事故対応の大事さ

読者の皆様、いつも読んで頂いてありがとうございます。





同業の方の中にも、一昨日のNHKクローズアップ現代で放送されたソフトウェアについての特集をご覧になった方も多いのではないかと思いますが私は昨日ビデオに撮ってあったやつを見ました。





番組の構成としては、日々の生活がますますソフトウェアに依存する中、ソフトウェアは複雑化、巨大化しほんの一部の間違いが致命的なトラブルに発展する可能性があること、そしてそれを支えるエンジニアの数が不足しており、現場は体力ギリギリの仕事を余儀なくされ倒れる人もいるという流れでした。





致命的なトラブルの一つとして、昨年10月に首都圏の改札が一斉に閉まってしまい、原因が究明され解決されるまで、鉄道会社が次の日の夕方くらいまで自動改札を全て開放し乗客は素通りさせる措置をとった事例が紹介されていました。





番組では「たった1行のコードの間違いがこういう事態を引き起こすのです」というトーンでしか説明していませんでしたが、私はこの事件が起こったときに鉄道会社の事故対応に感心してしまいました。





全ての改札が止まったわけではないし、その気になれば多少の混雑覚悟で稼動している自動改札と人手によって業務を続けるという選択肢もあったと思うのですが、鮮やかなほど早く「自動改札全面開放」の措置を事態が解決するまで取り続けました。この鉄道会社の対応がマスコミなどから非難された記憶は私は一切ありません。私もこの措置が正解だったのだろうと思います。しかし、考えようによっては1分毎にすさまじい量の損害が蓄積されていくのですから、とっさに判断できるかは難しいところです。





これだけしっかりした対応がとれていたのは、きちんとしたトラブル対策マニュアルが揃っていたからなんだろうなと思います。何もない状態であれだけ早い決断ができるというのは考えられないように思います。せいぜい、最初は人手と残った自動改札で業務を行い様子を見て全面開放くらいではないでしょうか。





ありとあらゆる事態を想定したマニュアルの策定の重要さを再認識した事故でした。