新型コロナ“自粛度データ”の謎。「アップル・グーグル頼み」が万全ではない理由

人混み

写真はイメージです。

撮影:今村拓馬

「あの商店街には人が集まっている」

「あの街はまだ8割削減を実現できていない」

SNSやテレビの報道には、そんな声があふれている。だが、こうした相互監視のような指弾に、本当に意味はあるのだろうか?

新型コロナウイルス(COVID-19)の流行に伴い「三密」の回避や移動の自粛、テレワークの推進といった「新しい行動様式」を一般化することが求められている現在、その根拠の一つとしての利用が増えているのが、スマートフォンからの位置情報を元にした「統計的人流データ」だ。

人流データをもとにした「自粛度」分析を見る機会が増える一方で、多くの人はそのデータがどういう性質のもので、どう処理され、どう読むべきかをあまりに知らなすぎるのではないか。

Agoopの柴山和久社長。

Agoopの柴山和久社長。

Agoop提供

ソフトバンク子会社で、政府へのデータ提供にも積極的に協力しているAgoop(アグープ)の柴山和久社長に、「人流データが示すものの意味」と「8割削減の是非」について聞いた。

アップル・グーグルのデータから「三密」を読んではいけない理由

3つの密を避けて欲しいと呼びかける小池百合子知事

3つの密を避けて欲しいと呼びかける小池百合子知事(3月25日の会見より)。

出典:東京都

3月31日、内閣官房IT総合戦略室・内閣官房新型コロナウイルス感染症対策推進室・総務省・厚生労働省・経済産業省は連名で、各ITプラットフォーマーに対し、統計的な位置情報の提供を呼びかけた。国内で言えば、NTTドコモにKDDI、ソフトバンク傘下のヤフージャパンや、今回の取材先のAgoopなどが参加した。グーグルやアップルのようなプラットフォーマーも協力している。

以来、我々は、ニュースなどで「今日はどれだけ人の動きが減った」「●●にはまだ人が集まっている」などの話題を耳にするようになっている。このことは、「移動自粛」の可視化という点でプラスではあっただろう。

しかし、その一方で、ビジネス現場などでデータを読むことに慣れた人は戸惑いも感じたかもしれない。

計測手法によって、「行動の自粛率」と読めるデータに大きなバラつきがあるからだ。

例えば、アップルの公表データで集計すると、東京の人出は、COVID-19が流行する前である1月を基準にして、4割程度にしか減っていないように見える。これは、カリフォルニア州・サンフランシスコ周辺に比べると低い値だ。

アップルが公開している人流データ

アップル提供のデータ。東京は、下のサンフランシスコに比べて、人の移動がまだまだ多いように見える。

出典:アップル

アップルが公開している人流データ

カリフォルニア州・サンフランシスコ周辺(ベイエリア)の人の移動の変化を示している。

出典:アップル

一方、Agoopのデータでは、2月(これ以前は人流量があまり変わっていない)と比較して、たしかに8割程度違っている場所もあるように見える。

shibuya

Agoop提供による、5月4日現在の渋谷駅のデータ。こちらを見ると、アップルのデータより人出は少なくなっている。

提供:Agoop

こうした「差異」はなぜ生まれるのか。

柴山氏は「そもそも双方のデータは用途が違うので、直接比べるべきではない」と説明する。

※アップルとグーグルは4月7日に、両社が共同で「Bluetoothを使った感染拡大防止ソリューションを共同展開する」と発表している。各国政府と協力の上、5月にはその第一弾となるアプリが公開される見込みだ。これは、ここまで挙げた「位置情報利用」とはまた別の存在であり、今回の指摘とは直接の関係はない。文字通り「用途が違う」。

さて、スマートフォンからは、いろいろなデータが取得できる。位置情報はその一例だ。

一般にこうした端末の位置情報は、地図アプリや情報検索系のアプリなどから、個人の同意に基づいて取得されている。その場合には、個人の名前や住所など、一般に個人情報と考えられているデータは含まない。

移動の履歴そのものはプライバシー情報の1つだが、同意に基づいて集めた上で、さらに、その「特定の個人」がどう動いたかではなく、年齢層や性別などの大まかな属性情報とセットで「統計的なデータ」として扱う。

ただ、個人を特定できなくすることは、統計データ化する上での一部に過ぎない。

「海外のプラットフォーマーは、各地域の昼間・夜間の人口データは持っていないでしょう。それらを組み合わせて『実際にそこに滞在したのは何人なのか』ということがわかるように統計処理を入れないと、必要な情報は出てきません」(柴山氏)

たしかによく見ると、アップルのデータには「2020年1月13日を基準量として比較した、国や地域または都市ごとの経路検索の相対的な量が表示されます」「Appleマップにはユーザに関する人口統計情報がないため、人口全体に対するAppleマップの使用量の代表性については言及することはできません」といった付記がある。

apple

アップルの情報提供ページより。データの性質がちゃんと記載されているが、引用される時にはこのことが考慮されていない場合が多い。

出典:アップル

考えてみればわかることだが、スマホからのデータを見ているということは、単にその場を電車や車で通り過ぎても、ずっとそこに住んでいても「位置情報としてはその時間、そこにいた」と記録される、ということだ。個人が特定できないのだから当然だ。

各個人の情報をとらず、匿名のデータから日本に住む人々の移動状況を正確に把握するには、「人口がどう分布していて、それがどう移動するのか」という統計処理を、正確に行う必要がある。

Agoopの場合には、日本全体を50m/100m/500m/1km単位のメッシュで区切り、それぞれの人口データを、時間ごとに処理した移動データと組み合わせて利用している。

Agoopが提供しているデータの形式

Agoopが提供しているデータの形式。新型コロナウイルス感染拡大予防に使われているのは、右の人口メッシュを考慮した形式だ。

Agoop提供

「(このことは)アップルやグーグルが持つようなデータが有用ではない、ということではない」と柴山氏は説明する。

「彼等のデータは、“今”人がどこに集まっているのか、というような、リアルタイムでの集計には役立ちます。例えば災害時に、どこへどう逃げるべきか、という判断などに使う場合です。

弊社もそういうリアルタイム系のデータと、メッシュに分けて統計処理を行うデータの両方を持っていますが、今回の新型コロナウイルスに向けた用途であれば、後者が向いています。処理が必要なので、データが出るまでにはどうしても時間が必要になるのですが」

オリ・パラや災害対策のための準備が効果を発揮

東京2020ロゴを掲示する東京都庁

Shutterstock

現在、政府に対して各事業者がデータを出して協力体制をとっていることには、伏線がある。

2018年3月、政府は「公的統計の整備に関する基本的な計画」を閣議決定した。これは、公的な統計情報と民間にあるビッグデータとを組み合わせて、データ活用を推進するのが目的だ。

その前には、2017年10月、総務省がNTTドコモ・KDDI・ソフトバンクの3社に協力を得て、それぞれの子会社から位置情報の提供を受け、「テレワーク・デイ」の効果測定を行なっている。

要は「テレワークによる人流減少」の状況を把握しようとしたわけだ。元々は、2020年に予定されていたオリンピック・パラリンピック対策のためだったわけだが、これは結果的に、新型コロナウイルスでの緊急事態宣言下で必要だった検証とまったく同じものだった。このとき、Agoopは、素性の違うNTTドコモのデータから得られた情報とも照合し、「同じような結果が得られている」ことを確認している。今回各社から集められたデータが活用されている裏には、これまでに検証・効果測定が行われていたから、という部分も大きい。

「人流データは、通常時には商圏の分析などのマーケティングに使われていますが、災害対策に使われているものも、全く同じものです。2018年から弊社でも、国立研究開発法人・防災科学技術研究所とともに、災害時の利用についてプラットフォーム開発を行っています」(柴山氏)

「8割減っても品川駅が相変わらず“危険”」

朝の品川駅(4月13日撮影)

朝の品川駅(4月13日撮影)。

撮影:竹井俊晴

一方、解析・可視化を経た後のデータであっても、それをどう理解すべきかは、難しい側面がある。「数字だけ」で判断すると、「それが実際に何を表しているのか」の実態分析が抜け落ちてしまうからだ。

「(例えば)品川駅には、平常時で20万人が集まります。現在はそれが8割減って、4〜5万人というところでしょうか。しかし、この状態でも『8割減ったから安全』なのではなく、危険であることに変わりはないんです」

柴山氏は続ける。

「休日にはさらに下がるのですが、そのレベルにならないと“三密でなくなった”とは言えません。一方、地方の場合、もともと人の数は少ない。例えば石川県・金沢駅は平常時に4〜5万人集まります。しかし、ここから8割削減するのは難しい。金沢なら3割削減でいいかもしれません」

shinagawa_kanazawa

Agoop提供による、5月4日現在での品川駅の人流状況。8割削減はできているものの、まだ平日は4万人以上が集まる。これが「休日並」にならなければ密集は減らない、と柴山氏は言う。金沢駅は品川駅ほど大きく減っていないが、これは元々の人口の関係が大きい。

Agoop提供の画像をもとに編集部作成

「メディアが東京を軸にして発するメッセージ」地方は精査を

4月7日の渋谷駅。

4月7日の渋谷駅。

撮影:竹井俊晴

現状の都内の場合、オフィス街を含め、絶対数で言えば、まだ人は減っていない。「テレワークできない人々」の危険性をどう軽減するのか、という問題も残っている。そして、地域によっては、もともと居住している人の移動が少ないため、単純な削減が難しいところもある。

「メディアが東京を軸にして発するメッセージに皆が乗ってしまう、というのは本当に危険です。例えば、温泉と商業地域と住宅地が一体になったような地域の場合、一斉に下げると地域経済が成り立たないところもあります。

各地域の状況を理解しているのは、やはり各地域の首長。一方的に国の号令をそのまま伝えるのではなく、市町村など、各地域の特性に合わせて、その行政のトップが判断し、地域住民に向けたメッセージを発するべきでしょう」

行政のトップからのメッセージが有効なのではないか、と柴山氏。

「東京の場合には、3月25日に、小池東京都知事が夜間の外出自粛を宣言し、その後に緊急事態宣言が出ると急速に下がりました。4月20日頃、江ノ島に人が集まってしまったことがありましたが、あれも黒岩神奈川県知事がメッセージを出すと下がりました。

その地域の首長がいうと、明確に数字が下がります。各地域の首長のメッセージに従うという日本の国民性が、メッセージを分析していてもわかります」

このことは、地方局や地方紙、地域情報メディアなどが、「地域密着の情報」「地域住民に向けたメッセージ」を発する重要な役割を負っている、ということも示しているのではないだろうか。

(文・西田宗千佳)

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み