大きなアプリケーションの中で、もっとも大切な部分はコンペ型式で作って、一番まともに動いたものを「一軍」、それ以外を「控え」にする。
これらとは別に、「正しい結果を出したかどうか?」を判定するプログラムを別に作って、「正しく動いていない」と判断された場合、同じデータを控えに回して、その結果を出力するようにする。
動作判定は素朴なもの、たとえば結果が出てくるまでの時間とか、得られたデータの桁数とか、そんなもので判定して、ちょっとでもおかしかったら次々に「控え」を前に出して、とにかくまともそうな結果が出るまで選手を入れ替えていく。
ひとつのデータの処理と出力が終了したら、また一軍が元の位置に戻って、次のデータの処理にかかる。

この辺のやり方はいろいろあると思う。

例えば、RAIDのようなイメージ。

そこそこの品質の同機能・別設計プロセスを流行のマルチコアで、並列に走らせる。もちろん、高度なプログラミングが要求されるモジュールだけを並列に走らせても良い。

当然、ひとつのプロセスがバグったり、フリーズしたりしても、そのプロセスだけ終了させれば良い。また、例えば、各プロセスの演算結果の「多数決」で、正しい演算結果を決め、信頼性を上げることも可能だ。子プロセスとして「部品化」させておけば、親プロセスには影響はないし。

部品は壊れるのが当たり前。

プログラムはバグを内包しているのが当たり前。

では、冗長性を上げるには？

すでにあってもいい考えだ。（…すでにありそうだなあ）

Permalink | 記事への反応(3) | 15:22