写真左からKDDIの執行役員 技術統括本部 副統括本部長兼エンジニアリング推進本部長を務める山本和弘氏。取締役執行役員専務 技術統括本部長を務める吉村和幸氏。
出典:KDDI
KDDIが7月2日から発生している大規模通信障害の「回復」の状況について、7月4日20時に緊急のオンライン説明会を開いた。内容は、障害対応の進捗についての詳細な報告だ
結論から言えば、既に一報が出ている通り、一般ユーザーについては音声、SMS、データ通信ともに「ほぼ回復している」というのがKDDIの見解だ。
現時点でも手元のスマートフォンなどでつながりにくい状況などが続いている場合、KDDIは端末の再起動を推奨している。
【2022年7月5日19:45更新】
KDDIは、7月5日18時から会見を実施。同日15時36分で、7月2日から全国のKDDI回線がつながりにくくなっている問題について、完全復旧を宣言した。
会見時点での障害による影響発生期間は7月2日1時35分から7月4日15時で、時間としては61時間25分。
復旧から完全復旧宣言までに約24時間かかったが、その間に音声通話におけるトラフィックの量が、障害発生前である先週日と同等であることを確認したという。
また、7月5日13時時点でのカスタマーサポート部門への通信障害に関する問い合わせ件数は9万6723件としている。
7月4日20時には、通信障害の「回復」の状況について、緊急のオンライン説明会が開かれていた。内容は、障害対応の進捗についての詳細な報告だ。
7月3日の会見後、想定外の事象でさらに長期化
障害の影響範囲。
出典:KDDI
既報の通り、今回の通信障害は7月2日1時35分から、全国のKDDI回線において、個人・法人を問わずつながりにくい状況が続いた。
KDDIによると、影響回線数は最大約3915万回線で、これにはスマートフォンやフィーチャーフォン、MVNO(格安SIM)向け回線、IoT回線、ホームプラス電話回線が含まれる。
同社は、7月3日11時に西日本エリア、同日17時30分に東日本エリアに関する修復作業を完了。その後、アクセス集中して処理能力を超える輻輳(ふくそう)状態を抑えるため、流量制限などを実施した。
7月3日の会見で明かされていた対応状況。
出典:KDDI
ここまでが、7月3日昼頃の会見で計画が発表され、実行された事柄だったが、7月4日の緊急説明会ではさらにその後、別の障害が発生していたことが明らかになった。
KDDIは7月3日の修復作業終了後に、ネットワークのトラフィックを監視。その中で、対処を行なったはずの「VoLTE交換機」および「加入者データベース(DB)」の負荷が当初想定していたより下がらなかった。
そのため、KDDIは7月4日7時時点の障害情報にて、「流量制御などの対処を講じているため、音声通話がご利用しづらい 状況が継続しております」と公表。ユーザーに障害が続いている旨を伝えた。
7月4日に新たに対応した内容。
出典:KDDI
その後、通常時18台稼動するVoLTE交換機のうち、6台が加入者DBに対して過剰な信号発信をしていることがわかった。
システムから該当する6台を取り除き、12台体制で稼動させることで、負荷を障害発生前と同水準まで戻した。
その後、7月4日14時15分には流量制限を解除し、ネットワークは「ほぼ正常」に戻った——というのがKDDIが説明する回復までの経緯だ。
なお、KDDIは7月4日16時付けの障害情報で初めて「音声通話・データ通信含め全国的にほぼ回復しています」としていた。
実際の復旧作業と情報開示の時差について、KDDI執行役員 技術統括本部 副統括本部長兼エンジニアリング推進本部長の山本和弘氏は「ネットワークの健全性の確認等、状況を確認していたため」としている。
完全にシステムを落とさないことが障害の長期化につながった
改めて陳謝する山本氏と吉村氏。
出典:KDDI
通信というジャンルにおいて、今回のような繋がらない・つながりにくくなる障害は、どのキャリアでも発生しうる。
けれど、つながらないという事象にまだらな部分があるとはいえ、今回は特に60時間を超える長期化してしまったことが、強く印象に残る。
中でも7月3日の会見後から発覚した原因の対処について、7月4日の説明会の質疑応答の中で、一部の記者からは「(原因とされるVoLTE交換機の切り離しを)最初からやっておけばよかったと考えられるか」という質問も出た。
それに対し、KDDIの吉村和幸氏(取締役執行役員専務 技術統括本部長)は「(正常に動いていたVoLTE交換機は全体の)3分の1よりもう少し多いぐらいいた(正常に利用できていた)お客様を支えていた。そこを抑えながら復旧することが大事だった」と説明した。
「システムを落とさないように作業したことが長時間化につながった」という認識は持ちつつも、「こういう状況にどうしたらならないのか、(今後)振り返っていきたい」(いずれも吉村氏)と今後の対応策に真摯に取り組む姿勢を示した。
障害の影響はユーザーによって違いがあるようだ。
撮影:小林優多郎
KDDIは今回の障害を「(電気通信事業法で定められた)重大事故と認識している」とし、「再発防止策をなるべく早く策定してご報告する」(いずれも吉村氏)としている。
また、前述の通り既にネットワークの状況はほぼ正常時と同様の水準に戻っているが、法人利用を含めたサービスの利用状況などを監視し、最終的な完全復旧の判断を7月5日夕方に行う方針を明らかにしている。
(文・小林優多郎)