2011年3月、大震災の後に発生したみずほ銀行のシステム障害。
その障害に関する調査報告書がみずほ銀行ホームページの一角に配置されています。
http://www.mizuhobank.co.jp/oshirase.html
この調査報告書、最近読んだ文書では特におもしろいものでした。
ただの報告書かと思っていたら、涙あり・笑いありの波乱万丈な内容だったからです。
・笑いどころ
えっ、そんな障害対応してるの?www 信じられないwww
という箇所がいくつかありまして。
手動対応してさらに障害が拡大するところとか、かなり笑えます。
そんなのが複数個所にあるんですよね~
・泣きどころ
みず○ほのえらい人「おい、早く障害対応しろ!オンラインが遅れるだろうが!」
み○ほのえらい人「営業開始が遅れたらお前、責任取れるのか!」
○ずほのえらい人「いつまでかかるんだ、この○○(←侮蔑的な言葉)が!」
みず○のえらい人「時間までに復旧しなかったらどうしてくれるんだ!」
言われる側である現場のみなさんの辛さを考えると、自然と涙が出てきます。
笑いと涙を交えながら、いろいろと考えさせられる点もありました。
1つは障害対応について。
上席者がシステムについてほとんど理解していなかったことが報告書からわかります。
・リミット値とは何なのか?
・リミット値を増加することによる影響は?
・データの復旧はどのようにして行うのか?
これらの疑問を理解している人がどれだけいたのか。
いたとしてもどれだけの時間がかかるのか。
報告書では訓練不足を指摘していましたが、その前提となるシステムへの理解が
組織としての体制の悪さ、丸投げ体質による上席者のシステムに対する知識・理解不足、
という弱点が浮かび上がったと思います。
ということを自ら露呈することとなりました。
多大な費用と時間が必要で、しかも利益は出ない対応となります。
しかし問題点が明らかになった以上、対応しないわけにはいきません。
最後に、この報告書の偉大なところは。
大規模なコンピュータシステムを所有するすべての企業に対して、
警告する内容となっているところです。
コンピュータシステムに関わっている人には、ぜひ読んで欲しい文書です。
「ばかな、こんなこと、ウチの会社では起こるはずがないwww」
って。
この報告書を読んで、
「ヤバい、ウチでも起こりそうだ…」
と恐怖したならば。
読み手によっては相当なホラーものとなるでしょう。
全文版をひととおり読んだ。 リミット値を再設定して実行→異常終了を繰り返していたり、障害箇所は違うようだが、義捐金、リミット値越えという意味では同じ障害(「B社」)が続い...