復旧対応に2日間
課題といえるのは、復旧するまでに2日間を要した点だ。
辻理事長は、「RCが内国為替制度運営費のテーブルを参照する際にエラーが発生していることは判明したものの、詳細な原因は不明であったため、対応に時間を要した」と反省する。
10日午後5時頃に、プログラム修正による暫定対処を行うことを決定し、10日午後11時までにプログラム改修を完了する予定だったが、改修箇所が多く、想定よりも作業が遅延。さらに、11日午前1時40分頃には、プログラム改修の検証でエラーを検知。11日午前3時45分頃にも、別のエラーを検知したことで、11日午前8時30分のコアタイムシステムのサービス開始までにはプログラムの修正が間に合わないと判断し、この方法による復旧を断念した。
新たな暫定対処方法を決定したのが11日午後1時頃。RCが内国為替制度運営費の金額を、一律0円と入力し、テーブルにアクセスしない仕組みとする暫定的なプログラム改修を行うことにした。コアタイムオンライン終了前から、先行してプログラム修正に着手し、12日午前3時30分頃に、この暫定対処が、問題なく起動していることを確認したという。
その一方で、この間、影響があった10行に代替対応を提案したが、これまでに行ったことがない作業であったことなどが理由となり、処理の遅れが相次いだ。10日と11日に渡り、コアタイムシステムの通信時間を1時間延長したが、11日通信終了時点での未処理件数は102万件にものぼっていた。
再発防止に向けた対策は
全銀ネットでは、今後の再発防止策として、委託先に対する牽制機能を強化すること、障害復旧対応における優先順位の整理、適切なタイムマネジメントの実施に向けたマニュアルの整備、BCP対応に向けた実践的訓練の実施、大規模障害時の全銀ネットにおける対応体制および役割分担の明確化、システム人材を確保を進めるほか、2024年4月には、新たにCIOを設置し、事務局体制を強化。RC障害対応タスクフォースや、RC障害対応ワーキンググループを設置した。
また、NTTデータでは、システム総点検タスクフォースを新設。第三者の立場から原因分析結果や再発防止策の内容を検証。基盤更改における品質保証の観点から、非機能観点の知識を持つ基盤人材を計画段階から参画させることや、NTTデータおよびグループ会社が、重要な開発プロセスを分担することで、当該プロセスの実態を把握し、トラブル時の復旧対応におけるフィージビリティの感度を高めるという。また、より本番環境に近い効率的な試験実施方法として、実取引相当のデータを用いた疎通試験を実施すること、全銀ネットとの合意の上で、障害発生時の復旧ガイドラインを策定すること、策定したガイドラインの有効性評価の訓練などを行うことを発表した。
移行を予定している金融機関の不安を取り除くことが大切
2024年1月には、3つの金融機関が「RC23」シリーズへの移行を予定していたが、1つの金融機関が移行を延期。2金融機関は暫定対処版で移行する方向で調整中しているという。
NTTデータの佐々木社長は、「今後、移行を予定している金融機関の不安を取り除くことが大切である。今回発表した再発防止策などをしっかりと説明し、金融機関からの相談にも対応をしていきたい」とし、「RC23」シリーズの更改は、個別の移行スケジュールに変更はあっても、全体の移行スケジュールには大きく変化はないとみている。
50年に1回の障害を、再発させないようにしなくてはならない。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります