ディープマインドの共同創業者、ムスタファ・スレイマン。
DeepMind
インターネットは今の姿から根本的に変化し、「旧式」の検索エンジンは10年でなくなるだろう——ディープマインド(DeepMind)の共同創業者であるムスタファ・スレイマン(Mustafa Suleyman)は、古巣であるグーグル(Google)に対して、そんな恐ろしい警告を発している。
スレイマンはポッドキャスト「No Priors」の最近のエピソードの中でこう語っている。
「私がグーグルにいたらかなり心配するだろう。旧式のシステムが10年後も今の地位にあることはなさそうだから」
スレイマンは2010年にデミス・ハサビス(Demis Hassabis)、シェーン・レッグ(Shane Legg)とともに、先駆的なAI企業となったディープマインドを立ち上げた。2014年にグーグルに買収された後も、タンパク質の構造を予測するAIモデル「アルファフォールド(AlphaFold)」など革新的なプロダクトを開発した。
スレイマンは数年前にグーグルを去り、インフェクションAI(Inflection AI)というスタートアップを共同創業した。同社は最近、初のプロダクトとなるパーソナルチャットボット「Pi(パイ)」の提供を開始した。
スレイマンは2019年、ディープマインドからグーグルのバイスプレジデントになった。ディープマインド内で、スレイマンがスタッフに対していじめを行ったとの疑惑に関する内部調査が行われた後の異動だった。この件に関してInsiderは、スレイマンの行為についての訴えは何年も前から上がっていたと報じている。スレイマンは謝罪し、自分は「完全にしくじった」と述べた。
スレイマンはグーグルを去る間際は、大規模言語モデル「ラムダ(LaMDA)」に取り組んでいた。本人によれば、同僚らとともにこのモデルを使った対話型・双方向型のプロダクトをリリースしようとしたもののグーグルを説得できなかったという。
「いろいろな理由でグーグルにとって適切なタイミングではなかった」とスレイマンは言い、悲しげに笑う。「私としては、これは世に出さなければと思っていた。間違いなくテクノロジーのニューウェーブになるぞと」
「私はグーグルでLaMDAを位置付けるうえで、対話こそが未来のインターフェースだと考えていた。グーグル検索だって既に対話だ。恐ろしく手間のかかる対話ではあるが」
検索エンジンが根本的な変更を余儀なくされれば、グーグルが失うものは大きい。同社はウェブの門番であり、何億ものサイトをクロールし、インデックスを作成し、ランク付けしている。同社の利益はほぼすべて、検索結果とともに表示される広告からもたらされている。
グーグルは現在、独自のチャットボット「バード(Bard)」を試験運用しており、そのテクノロジーの一部を検索に組み込んでいる。しかし、同社がこの新たなフォーマットからどうやってこれまでと同程度の利益を上げるのかは誰にも分からない。
グーグルがあってもなくても検索体験は対話型・双方向型に進化すると、スレイマンはくだんのポッドキャストで語っている。それはウェブの未来に、そしてウェブに頼って情報にアクセスしたり生計を立てたりしているすべての人に、大きな影響を与えることになる。スレイマンがポッドキャストで何を語ったか、以下で紹介しよう。
1980年代のイエローページ
スレイマン:グーグルに何か聞けば10件の青いリンクで答えてくれる。自分は10のリンクのどれかをクリックすることで何らかの情報をグーグルに伝える。
そうするとページが表示される。自分はそのページを見る。そして、ページにどれくらい滞在したか、どこをクリックしたか、どれくらい上下にスクロールしたかなどなどの情報をグーグルに伝えることになる。そして検索ボックスに戻り、新しいキーワードを入力して同じことを繰り返す。
これは対話であり、グーグルはこうやって情報を得ている。問題は、その対話のために使われている手法が1980年代のイエローページだということだ。でも今や我々はその対話を流暢な自然言語で行うことができる。
寸分違わずSEO対策されている
スレイマン:グーグルが、おそらく意図したわけではなく、インターネットにもたらした問題は、基本的に広告に最適化する形でコンテンツ制作を形成してしまったことだと思う。
今やすべてが寸分違わずSEO対策されている。ウェブページに行くと、テキストはすべてサブブレットやサブヘッダーに分割されていて、広告によって区切られている。だからページをスクロールして目的の情報を見つけるだけのために5秒、7秒、10秒かかる。多くの場合、そのちょっとした情報を見つけるためだけにアクセスしているのだ。
そのページを読むとき、このフォーマットは厄介だ。というのは、このページに5秒ではなく11秒滞在すれば、グーグルはそれをいわゆる「エンゲージメント」として高品質のコンテンツと判断するからだ。
だから、コンテンツ制作者は閲覧者をそのページに引き留めるよう動機付けられる。それは我々にとって悪いことだ。われわれ人間は明らかに、質問に対して高品質で簡潔で流暢な自然言語による答えが返ってくることを望んでいるからだ。そして重要なのは、「キーワードをどう変更すればいいか」などと考えずに応答を改善できることを望んでいるということだ。
われわれはグーグル検索に慣れてしまった。異常な環境だが、それに慣れてしまったのだ。われわれがグーグルと一緒になって20年かけて開発した奇妙な辞書なのだが、駄目だ。もうやめなければならない。もうおしまい。その時代は終わった。
今やコンピューターに向かって流暢な自然言語で話しかけることができる。それが新しいインターフェースだ。
誰もがパーソナルAIを持つようになる
スレイマン:今後数年で誰もが自分だけのパーソナルAIを持つようになると思う。いろいろなタイプのAIが出てくるだろう。企業向け、政府向け、非営利団体向け、政治家向け、インフルエンサー向け、ブランド向けなど。これらのAIはすべて、ユーザーの要望に沿った目的を持っている。何かを宣伝したいとか売りたいとか、誰かを説得したいとかだ。
思うに、皆がそれぞれに自分だけのAIを望んでいる。自分の関心に沿ったAI、自分のチームにいる味方のAI。それがパーソナルAIだ。われわれのそれは「Pi(パイ)」という名前で、「パーソナル・インテリジェンス(Personal Intelligence)」の略。人間の相棒となるものだ。
われわれは共感的で協力的なスタイルから始めた。良い対話を実現するにはどうすればいいかと最初に自問するようにしている。
インターネットの構造に何が起こるか
スレイマン:根本的に変わると考えている。コンピューター操作の大半が対話になると思う。そしてその対話の多くがさまざまな種類のAIによってサポートされることになる。
Piが朝のニュースを要約してくれるとか、サボテンなりバイクなり自分の趣味について常に情報を教えてくれるとか。自分の読み方や興味、情報消費の好みに正確に合わせて2、3日おきに最新情報を要約して送ってくれるのだ。
一方、ウェブサイトや従来のオープンインターネットには固定されたフォーマットがあり、誰もが単一のフォーマットを求めていると想定されている。生成AIが明確に示しているのは、それをダイナミックかつ創発的で全体的にパーソナライズされたものにできるということだ。
私がグーグルにいたらかなり心配するだろう。旧式のシステムが10年後も今の地位にあることはなさそうだから。一夜にして起こることではないし、移行期間はあるだろうが、この種の簡潔でダイナミックなパーソナル対話型AIこそが未来であることは明らかだ。
コンテンツ制作者への助言
スレイマン:AIはある意味、ウェブサイトやアプリと同じようなものだ。例えばお菓子作りについてのブログを書いているとする。AIを使えば今でも超高品質のコンテンツを作ることができるが、AIはこれからもっと魅力的で双方向的になり、他の人が話しかけられるものになる。
私に言わせれば、どのブランドも既にAIのようなものだ。ただスタティックなツールを使っているというだけ。広告業界は数百年前から、色、形、テクスチャー、テキスト、音、画像を利用して意味を作り出してきた。半年ごと、1年ごとに新しいバージョンが出ていた。
今はそれがずっとダイナミックで双方向的になりつつある。AIが1種類とか5種類だけになるという考えにはまったく賛成しない。完全に見当違いで根本的に間違っていると思う。何億、何十億ものAIが存在することになる。そして個人向けのプロダクトも出てくるだろう。
完全に独立に動いて勝手に自分のことをやっているような自律AIをわれわれは望まない。いい結果につながらないからだ。ブロガーがコンテンツを見せるためにAIを使ったら、おそらくこんなふうになるだろう。
私のPiがそこに行ってそのAIに話しかけて、「うちのムスタファはお菓子作りにすごく興味があるんだけど、卵すら割れないんだ。何から始めればいい?」と聞く。そうやってPiがAIと対話して、「ああ、おもしろくて興味深い話だった。ムスタファはとても気に入るだろう」となる。それからPiが私のところに戻ってきて、「今日はこんなすごいAIを見つけたよ」と言うわけだ。
私がそのAIと話せばすごくおもしろいものが見つかるかもしれない。あるいは、私とAIが対話する様子を記録しておいて、この3分動画を見てください、みたいな。
新しいコンテンツはこんなふうに作られるようになると思う。そして、対話者として行動して他の世界にアクセスするのは自分のAI、Pi、パーソナルAIになるだろう。
ところで、これはグーグルが現在やっていることと基本的には同じだ。グーグルは、既存の手法でスタティックに作られた本質的にはAIと同じようなものをクロールし、それらとちょっとしたやりとりをして、それらをランク付けしてユーザーに見せているのだから。