あなたの匿名アカウントは本当に匿名だろうか。
撮影:今村拓馬
顔知られたくない、こんな発言知り合いに見られたくない、この趣味は知られたくない、等。貴方なりの身分晒すリスクを教えてください!匿名を責めてはいません(抜粋)
メジャーリーガーのダルビッシュ有選手が2019年12月、Twitter上で匿名アカウントの使用をめぐり、意見を募った。匿名アンチがTwitter上で誹謗中傷を繰り広げる現状へ苦言を呈した流れのものだ。
日本のTwitterユーザー数約4500万のうち、7割超が匿名アカウントとされ(総務省「情報通信白書」)、複数アカウントを使い分ける10〜20代は少なくない。
ところで、そもそも本当にそのアカウントは「匿名」なのだろうか?その「前提」をも揺るがしているのが、AIによるプロファイリングの存在だ。
AIは50%の確率で本人のものと照合
78の匿名アカウントの日頃の投稿データから、AIは年代、性別、所属、趣味、帰省先などを予測した。
Shutterstock
「Twitterの匿名アカウントの人物と、実生活の個人の照合は、年代や性別、趣味といった情報が書かれている履歴書があれば、高い確率で個人特定することができます」
そう話すのは、電気通信大学大学院教授で、情報学専攻の吉浦裕氏だ。
吉浦研究室では「プライバシーの攻撃」をテーマに、78人の被験者の同意の下、この人たちの78の匿名アカウントの日頃の投稿から、AIを用いて特徴をプロファイリング(個人データに基づいて個人の能力や属性を分析・予測すること)。AIはTwitterの投稿内容を元に、年代、性別、所属、趣味、帰省先など340項目を予測した。
その結果、AIは78の匿名アカウントのうち39アカウント(50%)を、被験者本人のものと特定した。実験にあたり事前にAIに学習させたのは文字のTweetのみで、画像やプロフィールを入れると精度はさらに上がるという。
このことは何を意味するのか。
「多くの企業や組織は社員の履歴書を持っています。例えば内部告発をするアカウントの特徴をプロファイリングして履歴書と類似性を判定し、告発者を特定することが技術的には可能です」(吉浦氏)
個人名簿とビッグデータの付き合わせで見えること
電気通信大学大学院の吉浦裕教授。個人のプライバシーへの攻撃がどこまで技術的に可能かを研究する。
撮影:滝川麻衣子
今度は、78人の匿名アカウントを1万アカウントに混ぜ込んでシャッフル。誰のアカウントか分からなくした上で、AIを使ったプロファイリングで78人のアカウントを探したところ、これでも5人(6%)については本人アカウントを特定。20人(26%)については、本人アカウントの可能性があるとみられる100アカウントにまで絞り込めた。
「(AIが絞り込んだ)100アカウントからならば、人力でさらに詳細な調査が可能です。結局、本人のアカウントが特定できる可能性は高いと言えます」(吉浦氏)
これを現実世界に落とし込むと、こうなる。
「例えば企業が就職や転職希望者に注目し、履歴書と匿名アカウントの類似性から本人アカウントを判定することも、技術的にはやろうと思えばできるのです」(吉浦氏)
個人データが企業利益に使われる衝撃
就活生の個人データから割り出された「内定辞退率」は、数百万円単位で採用企業に売られていた。
撮影:今村拓馬
この事実は「個人データが勝手に分析・照合され、思いもよらぬ方法で使われる」という点で、2019年に発覚したリクルートキャリアによる就職情報サイト「リクナビ」の「内定辞退率」販売問題を連想させる。
同社は過去に内定を辞退した学生の行動履歴をAIに学習させ、リクナビサイトに登録している就活生の内定辞退率を算出。クライアント企業に400万〜500万円で販売していた。企業は企業で、過去の就活生の学歴や選考結果をリクルートキャリアに提供していた。
個人情報保護委員会や厚生労働省は、個人データの扱いに問題があったとして行政指導に踏み切り、38社の利用企業名を異例の全公表。トヨタ自動車、三菱商事、京セラ、りそな銀行など名だたる大企業が利用していたことが明るみになった。
リクナビ問題は就活生のみならず、日本社会にある種の衝撃を与えたと言える。
本来、学生のものであるはずのデータが、本人がその用途を知らされないままに、リクルートキャリアやそのクライアント企業の利益を優先に扱われていることを、浮き彫りにしたからだ。
「リクルートがこんなに叩かれるとは……」とのホンネ
そしてリクナビ問題は、日々、スマホ画面に指を走らせる私たちにとって決して他人事ではない。
人材業界はAIを用いたサービスが一種のブームで、リクナビ問題を受けたある人材業界関係者からは「こんなに叩かれるとは……」との声が漏れ聞こえてきた。
TwitterのようなSNSはじめ、私たちの行動データはインターネットでつながるプラットフォーム上にあふれている。データから予測された内容で、面接を落とされたり、評価を下げられたり、昇進を止められたりすることは「絶対にない」と、本当に言えるだろうか。
個人データとAIめぐる危機感に動く世界
慶應義塾大学法科大学院教授の山本龍彦氏は「2019年は個人データをめぐる人権宣言のなされた年」だと振り返る。
撮影:竹井俊晴
「2019年は世界的にどうAIを扱っていくが示された、個人情報とAIをめぐる重要な年だったといえます。50年後、100年後に振り返った時に『世界的な規模で、ある種の人権宣言がなされた年』と、見なされるのではないでしょうか」
そう指摘するのは、憲法と情報法が専門の慶應義塾大学法科大学院教授の山本龍彦氏だ。
AIと個人データをめぐる出来事で2019年を振り返ってみれば、それは明白だ。
- 3月に日本で内閣府が「人間中心のAI社会原則」を公表。
- 4月には欧州委員会が「AIに関する倫理ガイドライン」を発表。
- 5月にはOECD(経済協力開発機構)諸国が、AIに関する初の国際的なガイドラインを採択。
- 5月にはAIの扱いに関しては、より監視的と批判されがちな中国政府も「北京AI原則」を発表。
個人情報と膨大なデータが結び付けられ、個人のあずかり知らぬところで使われた時に起きる深刻な事態に、各国が動き出している。
なぜなら、個人データとAIをめぐる規制は、経済戦争とはまた別の深刻さを伴うからだ。
プライバシーの本当の危機は情報漏洩にとどまらない
EUが個人データ保護に手厚い理由は、ナチスドイツの暗黒の歴史にさかのぼる。
shutterstock/Everett Historical
例えばEUが一般データ保護規則(GDPR)を施行したのは「何もGAFA(グーグル、アマゾン、フェイスブック、アップル)を狙い撃ちするためでははない」と、山本教授は指摘する。
「EUが個人データ保護に手厚いのは、ナチスドイツによるホロコーストの歴史があるからです。ナチスは個人データを分類してユダヤ人の識別を行った。プライバシーの侵害は単なる情報漏洩の問題ではなく、本人の知らないところでデータが連結され、個人が選別される恐ろしいもので、人間の尊厳を侵害する行為に直結すると、認識されている」
アメリカは2016年の米大統領選挙で、トランプ陣営が雇った調査会社ケンブリッジ・アナリティカのスキャンダルが発覚。数千万人分のFacebook利用者データが、ビッグデータ解析に不正利用され、選挙結果に影響を与えた可能性が指摘された。
個人データの乱用は、民主主義の危機や差別助長につながる——。こうした危機感が高まったことが、カリフォルニア州で、消費者に個人データ使用の拒否権を認める消費者プライバシー法(CCPA)の発効(2020年1月1日)を実現し、複数の州が同様の法整備に乗り出している。
企業にデータ利用をやめさせる権利
個人情報保護法の改正で、個人が企業に対し「データ利用をやめさせる権利」が実現する見込みだ。
撮影:今村拓馬
では、日本はどうか。
「日本の場合、無秩序なデータ利用が行われてきた面がある」
そう、慶應義塾大学法科大学院教授の山本氏は指摘する。
名だたる大企業が処分を受けたリクナビ問題の例にも象徴されるような、倫理性に欠ける個人データ利活用がある。一方で、学校や組織で個人の連絡先を入れた名簿が作りにくいといった、過剰な反応も起きている。
それでも世界的な潮流の中で2019年は「データ保護では従来、遅れてきた日本でも、ようやく地殻変動が起きた年」(山本教授)と言えそうだ。
前述の「人間中心のAI社会原則」(3月)を筆頭に、政府は個人が企業に対し「データ利用をやめさせる権利」を盛り込んだ、個人情報保護法の改正骨子を2019年11月に策定。
続けて12月には
- GAFAなど巨大IT企業に契約条件の透明化
- 独占禁止法の運用強化でデータ囲い込み禁止
といった、データ周りの規制策も打ち出された。
こうした2019年の地殻変動を受けて始まる2020年代を、山本教授はこう表す。
「プリンシプル(原理原則)をプラクティス(実行)に持っていく世界が始まる」
AIネットワークが張りめぐらされる社会で、実際に個人のデータがどう使われ、どう生活を変えていくのか。各国が打ち出した「AI時代の人権宣言」は、実社会でどう機能するのか。
2020年代、私たち個人とAIの関係で、新たなフェーズが幕を開けたことは間違いない。
(文・滝川麻衣子)