高信頼システム特論

故障マスク 故障の影響を隠す
 多数決冗長
  TMR(Triple Modular Redundancy) 3入力の多数決回路
  NMR(N-Modular Redundancy)n入力の多数決回路(多数決のためn%2 = 1 奇数)
 
 TMRは時間が経過するごとに信頼度が低下する

 多数決機構が完全でない場合も想定されるので、複数の多数決機構を設ける(三重化TMR)
 ただし、最後の1個は力学的特性で多数決を取るなどしてるのが実際(計算機と力学の境界)
 ★誰かと思ったらあの先生三宅裕二に似てるんだな。声とかよく似てる。三宅裕二のオールナイトニッポン http://www.nikkansports.com/ns/entertainment/interview/2003/sun030803-2.jpg

誤り検出符号
 ハミング距離の定義(1ビット誤り=1)
★ やっべー、わからなくて授業受ける気がしねー。ずっと課題とブログの更新してたよ。

動的冗長方式(システム再構成) 動的なシステムの切り替え
 動的2重化(多数決では故障判定を兼ねる、選択的な話)
  故障が発生したら切り替える
  故障モジュールの判定方法
   自己診断プログラム(本来の処理に入れ込む)
   セルフチェッキングモジュール
   ウォッチドッグタイマ
   外部テストプログラムの実行
  問題は同期
   クロックレベル(nsオーダー、ハードウェア) - 故障マスクはこの辺り 
   パス通信レベル(msオーダー、ソフトウェア)
   タスクレベル(10〜100msオーダー、ソフトウェア)
   ※クロックレベルはノイズが怖いので、それ以外の方がよく使われてる。クロックレベルは半ずらしすればいいんだけどね

 待機冗長システム
  故障検出能力に信頼性が依存
   二重化・比較
   論理回路レベル
   プロセスレベルの誤り検出
   無矛盾チェック/資格チェック(OSが行う)
   定期的テスト
★要は方法によって性質(数式)が異なる。その中から選ぶってことだろうね。ポイントは信頼性の算出・評価だ。
  待機システムのスタンバイ方法
   ホットスタンバイ(待機系もメインと同じ動作をする)
   ウォームスタンバイ(電源はONだが、他の動作をしている)
   コールドスタンバイ(電源がOFF。故障しにくい、長期的に信頼性が確保できる・・・はずだが、電源のON/OFFの繰り返しって結構怪しいよね)
  いずれにしろカバレッジ(故障検出能力)が1な限りにおいて非常に信頼性がたかい。そりゃそーだ
 ハイブリッド冗長システム
  HMR、多数決と待機冗長システムを組み合わせた方式
 セルフパージング冗長システム
  故障モジュールが自分からシステムから自信を切り離す
 SNV方式(「ひてん」)
  先生の考案した方式。モジュール自信が信号を送って切り替えるようにする。これはこれでスケーラビリティがよさげじゃない?

冗長化の方式
 物理的冗長
  距離・台数
 時間的冗長
  電気的ノイズ・宇宙線放射線(時間をズラすことによって影響から逃れる)
 空間的冗長
  物理的と似ている
 設計冗長
 環境的冗長
  状態遷移の冗長化?ああ、要は困ったらリブートの事ね。 
 データ冗長
  入力するデータの多様性(Diversity)を確保