NTTドコモは10月14日17時ごろから全国規模の通信障害を起こした。
撮影:小林優多郎
NTTドコモは10月15日、10月14日17時ごろから発生している通信障害に関する緊急会見を開催。障害について陳謝し、原因や現在の状況などを説明した。
NTTドコモの会見の様子。会見の冒頭、田村穂積副社長は「多くの方々にご迷惑、ご心配をおかけすることをお詫び申し上げます」と謝罪した。
出典:NTTドコモ
今回の通信障害にあたっては、金子恭之総務相が「このように大規模な影響を及ぼす障害が発生したことは大変遺憾」とコメントするなど、対応が注目を集めている。
会見の質疑からは、障害の原因のみならず、その後の「完全復旧」アナウンスの方法についても、疑問を残すものになっていた。
ドコモの通信障害が起こったメカニズム
時系列で見た障害発生状況。
出典:NTTドコモ
今回の障害は全国のNTTドコモ利用者の一部、および同社のネットワークを活用した格安SIMなどを提供するMVNO利用者の一部が対象。通話やデータ通信のできない不具合が発生した
4G(LTE)および5Gのネットワークについては15日午前5時5分において回復。3Gについては会見のあった午後2時過ぎの時点でも復旧のめどは立たず、会見内でも「明確には答えられない」と言うに留まっている。
(2021年10月16日0時40分追記)
その後、NTTドコモは15日22時に3Gでも回復した旨を公表した。
利用者として当然気になるのは「なぜ、通信障害が起きたのか」という部分だろう。
障害発生原因。
出典:NTTドコモ
NTTドコモの資料によると、原因は自動販売機やタクシーなどの車載決済端末に利用されているIoTサービスに関するサーバーの切り替え工事にあった。
NTTドコモは10月14日未明から、該当サービスのサーバー切り替え工事を実施。
午前7時26分に新設備切り替え後に不具合を確認したため、旧設備への切り戻しをスタートさせた。
16時36分、切り戻したのちに対象となるIoT機器に対して、円滑な通信のために必要な位置情報の再登録を促す措置を行った。
だが、17時ごろにIoT機器による位置情報信号のトラフィックが増大。輻輳(ふくそう、アクセスが集中して処理速度が低くなったり、システムそのものがダウンする状態)が発生。一般ユーザーの利用する回線にまで波及していった。
IoT機器による輻輳は、一般ユーザーの端末にも影響を及ぼした。
出典:NTTドコモ
NTTドコモはネットワーク全体の保全を図るために、17時37分には全国規模の100%の通信制限(ネットワークコントロール)を約2時間30分にわたって実施した。
したがって、一般ユーザー視点で見ると、17時ごろを起点に4G/5G機器ユーザーであれば最長で翌日10月15日午前5時5分まで、3G機器ユーザーであれば15日22時までつながらない・つながりにくい状態が続いた。
何が原因だったのか
今回の障害の原因をいくつかのポイントを挙げるとすれば、以下の2点に集約できる。
- なぜ、古いサーバーへの切り戻しが必要な状況になってしまったのか。
- 切り戻しが必要になったとして、輻輳が発生するような状況に、なぜ陥ってしまったのか。
1点目について、そもそもの古いサーバーへの切り戻し(アップデートのやり直し)が起こったのは、該当サービスを海外で利用する顧客やオペレーターから不具合報告があったためだ。この原因については、究明して対処できるまで今後同様の移行工事は行わないとしている。
2点目は、簡単に言えば「なぜ輻輳状態を避けられなかったのか」ということだ。
切り戻した際には位置情報の更新を促すことになるため、ドコモとしてもIoT機器を起因としたトラフィックの増大は当然予想していた。
NTTドコモの会見の様子。
出典:NTTドコモ
質疑に答えたNTTドコモのサービス運営部長を務める引馬章裕氏は、「(旧設備側の)処理能力の見積もりの甘さ」があったと話す。
結果的に、旧設備側がさばき切れない量のIoT機器からの信号があったため、「トリガーをひいてしまった(輻輳の引き金を自らひいてしまった)」(引馬氏)としている。
NTTドコモは今後、より詳細な原因究明や影響規模の精査をする。
同社はすでに管轄省庁である総務省へ報告はしているが、総務省が今回の事案が電気通信事業法施行規則第58条第1号に基づく「報告を要する重大な事故」に該当すると判断した場合、事故発生から30日以内に詳細を報告する必要がある。
完全復旧報道“9時間のズレ”
障害発生中の10月14日18時11分ごろ、筆者は東京23区内にいたが、突如NTTドコモのアンテナ表示が消えて通信できなくなったため、端末に設定してあった予備の楽天モバイル回線に切り替えた。
スクリーンショット:小林優多郎
筆者も今回の通信障害の影響を受けた。
手持ちのNTTドコモの5G回線が14日17時以降はスマートフォンでアンテナ表示が立たない状態になり、通話もデータ通信もできなかった。
通信制限緩和後(19時57分以降)、通信できる状態に一時的に戻ったが(20時25分)、その後すぐに元の何も通信できない状態に戻ってしまった。
今回の事故はあくまでもドコモ側の作業によるもので、ユーザーが対処できることはほとんどない。
障害発生から緊急会見に至る時系列を見る中で、気になっていたのは、NTTドコモの当日の広報対応と報道各社の速報対応だ。
NTTドコモ広報部は、(4G/5Gの)完全復旧は前述の通り発生後翌日の5時5分としており、「一時回復」と報じたのも21時4分頃としている。
しかし、当日の様子を振り返ると、複数の大手報道媒体が20時過ぎから「完全復旧」と報じていた。
事後ではあるものの、ドコモ側からの事実認識を見る限り、実際に完全復旧した9時間ほど前に「完全復旧」との報道が出てしまっていたことになる。
ユーザーからしてみれば、完全復旧とメディアが報じていれば「じゃあ試してみよう」と何らかのアクションを起こす可能性は高い。この9時間のズレが、ネットワークの回復状況に何らかの影響が出る可能性はなかったか。
これに関し、NTTドコモ側は質疑の中で「(ユーザーから発生したトラフィックより)IoT端末の影響度の方が大きかった」としているが、「今後についてはお知らせの掲示文についても誤解がないように、輻輳が起きないようにしたい」と答えた。
9時間のズレについては質疑で明確な言及はなかったが、生活インフラとしての影響の大きさを再確認する出来事と言える。
(文・小林優多郎)