みずほ銀行さんのシステム障害の件、何かしらの教訓がないか探るべく
ニュースや会見から事実関係をメモしてみます。
自分自身も当事者だったらと思うと、とても他人事とは思えません。
時系列
日時 | トピック |
---|---|
2/28 09:50am頃 | 最初のエラー検出(ログ)。この時点では大ごとと認識できてない。個別の現場対応 |
2/28 11:00am頃 | 障害が発生(ATMに取り込まれることではなく、みずほオンラインの障害) |
2/28 午後 | ATMの件含め大ごとになっていることを経営陣までが認識し、金融庁へエスカレーション |
3/01 15:00頃 | ATM全て復旧 |
3/01 19:30頃 | 記者会見 |
3/03 20:00頃 | 【障害発生】全国28拠点のATMでシステム障害が発生(キャッシュカードが戻らない等) |
3/04 夕方頃(報道) | 紙の通帳からデジタル通帳に切り替える作業によって起きたことが新たに判明 |
3/07 08:00頃 | 【障害発生】一部のATMやインターネットバンキングで定期預金の預け入れができない |
3/07 13:30頃 | 【障害復旧】上記障害が復旧 |
みずほ銀行公式
-
公式ホームページ(トップ):2021/03/01 22:00時点
-
公式ホームページ(トップ):2021/03/04 09:30am時点
-
公式ホームページ(トップ):2021/03/08 03:10am時点
2021/03/01 会見メモ
仕事しながら片手間に聞いてたので誤認識あるかも。発見し次第、適宜修正します
障害内容
- カードや通帳を取り込んだまま戻さないのは、本来は不正利用された場合などへの安全装置
- 原因は定期預金のデータ移行作業(※システム屋の表現では、ステータス・フラグ変更)
- (こいつはもう一年以上使われてない、というものをステータス一括置換する感じに聞こえた)
- 3/4の続報より、紙の通帳からデジタル通帳に切り替える作業だったことが判明
- 月末の処理件数が重なり、システムに負担が掛かった
- 今回のステータス変更作業(非定常業務)は、月末にやる必要はなかったとのこと
- (業務目線でのレビュー、試験が必要だった?)
- 月末のシステム負荷はかなり高い(通常15万件が25万件になる)
- 今回のステータス変更作業(非定常業務)は、月末にやる必要はなかったとのこと
-
システム負荷によるエラーで安全装置が誤作動した流れ?
- (→会見を質疑応答しか聞けなかったので憶測)
暫定対応
- メモリを5倍にした
- これにより、同じ原因での障害は再発しない
- (OutOfMemoryの類の模様)
- メモリは一度上げると下げられない
- これにより、同じ原因での障害は再発しない
その他議論
-
みずほ独自の基盤(MINORI)部分
- 他行を無視したMINORIは必要だった? →みずほの発展のために必要不可欠
- その前のシステムは1988年からのもので、耐えられない状態だった
2021/03/03 障害が再発生
- ハードの不具合によりシステムセンター間のネットワーク瞬断が発生した
- 2月28日に発生した定期性預金のデータ更新作業に起因するシステムトラブルとは別の要因で発生した
2021/03/07 障害が再々発生
- 7日午前8時ごろから一部のATMやインターネットバンキングで定期預金の預け入れができなくなった
- カードローンのプログラムを更新する作業でエラーを検出したため、意図的に止めた模様(みずほ公式の案内より)
- 午後1時半ごろまでに復旧した
参考
ニュースサイト
- 2021/02/28
- 2021/03/01
- 2021/03/02
- 2021/03/03
不具合がシステム全体に影響するのを防ぐため、基幹システムがATMとの連携を一部遮断。2019年に導入した新システムの「自衛機能」が働いた格好だが、この結果、ATMの処理速度が低下。取引の異常を検知したATMが「預金者の被害を食い止めるため」(同行関係者)に、カードや通帳を次々と飲み込む事態にまで想定が及ばなかった
-
2021/03/04
-
2021/03/07