高信頼システム特論
故障マスク 故障の影響を隠す 多数決冗長 TMR(Triple Modular Redundancy) 3入力の多数決回路 NMR(N-Modular Redundancy)n入力の多数決回路(多数決のためn%2 = 1 奇数) TMRは時間が経過するごとに信頼度が低下する 多数決機構が完全でない場合も想定されるので、複数の多数決機構を設ける(三重化TMR) ただし、最後の1個は力学的特性で多数決を取るなどしてるのが実際(計算機と力学の境界) ★誰かと思ったらあの先生三宅裕二に似てるんだな。声とかよく似てる。三宅裕二のオールナイトニッポン http://www.nikkansports.com/ns/entertainment/interview/2003/sun030803-2.jpg 誤り検出符号 ハミング距離の定義(1ビット誤り=1) ★ やっべー、わからなくて授業受ける気がしねー。ずっと課題とブログの更新してたよ。 動的冗長方式(システム再構成) 動的なシステムの切り替え 動的2重化(多数決では故障判定を兼ねる、選択的な話) 故障が発生したら切り替える 故障モジュールの判定方法 自己診断プログラム(本来の処理に入れ込む) セルフチェッキングモジュール ウォッチドッグタイマ 外部テストプログラムの実行 問題は同期 クロックレベル(nsオーダー、ハードウェア) - 故障マスクはこの辺り パス通信レベル(msオーダー、ソフトウェア) タスクレベル(10〜100msオーダー、ソフトウェア) ※クロックレベルはノイズが怖いので、それ以外の方がよく使われてる。クロックレベルは半ずらしすればいいんだけどね 待機冗長システム 故障検出能力に信頼性が依存 二重化・比較 論理回路レベル プロセスレベルの誤り検出 無矛盾チェック/資格チェック(OSが行う) 定期的テスト ★要は方法によって性質(数式)が異なる。その中から選ぶってことだろうね。ポイントは信頼性の算出・評価だ。 待機システムのスタンバイ方法 ホットスタンバイ(待機系もメインと同じ動作をする) ウォームスタンバイ(電源はONだが、他の動作をしている) コールドスタンバイ(電源がOFF。故障しにくい、長期的に信頼性が確保できる・・・はずだが、電源のON/OFFの繰り返しって結構怪しいよね) いずれにしろカバレッジ(故障検出能力)が1な限りにおいて非常に信頼性がたかい。そりゃそーだ ハイブリッド冗長システム HMR、多数決と待機冗長システムを組み合わせた方式 セルフパージング冗長システム 故障モジュールが自分からシステムから自信を切り離す SNV方式(「ひてん」) 先生の考案した方式。モジュール自信が信号を送って切り替えるようにする。これはこれでスケーラビリティがよさげじゃない? 冗長化の方式 物理的冗長 距離・台数 時間的冗長 電気的ノイズ・宇宙線・放射線(時間をズラすことによって影響から逃れる) 空間的冗長 物理的と似ている 設計冗長 環境的冗長 状態遷移の冗長化?ああ、要は困ったらリブートの事ね。 データ冗長 入力するデータの多様性(Diversity)を確保