検索で感染を追跡…グーグルがコロナ関連の検索データを公開

Google Healthの責任者、デイビット・フェインバーグ。

Google Healthの責任者、デイビット・フェインバーグ。

Courtesy HLTH

  • グーグルは、研究者や公衆衛生当局向けに、COVID-19の症状に関連する検索傾向の膨大なデータを公開している。
  • グーグルが完全に匿名化しているというこれらのデータは、400を超える症状があることを明らかにしている。
  • ウイルスがどのように広がっているかを追跡するためにもデータの活用が望まれる。

グーグル(Google)は、アメリカにおけるCOVID-19の症状に関する検索傾向のデータベースを公開している。これは、公衆衛生当局や研究者がウイルスがどのように広がっているかを追跡するのに役立つことを期待してのことだ。

グーグルは、咳、発熱、呼吸困難など400種類以上の症状をユーザーが検索したデータセットを構築した。グーグルによると、収集したデータは匿名化されており、アメリカの郡レベルでの症状関連の検索件数の傾向を示しているという。

しかし、グーグルは具体的な検索件数を明らかにしていない。その代わりに、Google Trendsツールと同様に1から100の尺度で検索ワードを数値化し、研究者が検索傾向の急上昇を識別することができるという。

データはまた、特定の検索そのものを表示することはないが、COVID-19に関連する可能性のある症状や状態にマッピングされる。

データはGoogle CloudあるいはGitHubから入手できる。データセットには2017年までさかのぼった検索が含まれており、研究者は過去の年の傾向とも比較することができる。

現時点では、このデータはアメリカのみが対象で、英語とスペイン語で行われた検索に関するデータが含まれている。また、プライバシー保護のために設けられた検索基準を満たすデータのみが対象になっているという。しかし、その基準については明らかにされていない。

広報担当は、データは差分プライバシー(differential privacy)を使用して生成されたと付け加えた。これは、データが個々のユーザーに結びつかないように、データにノイズを加える技術だ。

「研究者はこのデータセットを使用して、検索傾向が国内のさまざまな地域でのウイルスの再発生をより早く、より正確に示すことができるかどうかを研究することができる」とGoogle Healthのシニア・スタッフ・リサーチ・サイエンティストのエヴゲーニー・ガブリロビッチ(Evgeniy Gabrilovich)は述べている。

データには、COVID-19に直接関連する症状とともに、グーグルが「二次的影響」と呼んでいる、不安やうつ病などの検索が含まれている。これらは、パンデミック中に件数が上昇している。

グーグルがユーザーの行動に関する膨大なデータをパンデミック対策に活用したのは、今回が初めてではない。2020年の初めには、COVID-19の間に人々がどのように移動しているかを明らかにするために、ユーザーのデバイスから得た位置データを使用する「コミュニティ・モビリティ・レポート」を公開した。

疾病に関連する検索トレンドを追跡しようとしたのも初めてではない。2008年にローンチされた 「Google Flu Trends」 と呼ばれるツールは、検索活動に基づいてインフルエンザの流行を追跡しようとしたが、インフルエンザの流行を大幅に過大評価したため、2015年に廃止された。

[原文:Google is releasing data on how people have been searching for COVID-19 symptoms, in the hope it will help researchers track the virus

(翻訳、編集:Toshihiko Inoue)

  • Twitter
  • Facebook
  • LINE
  • LinkedIn
  • クリップボードにコピー
  • ×
  • …

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み