グーグルは2019年、複雑な検索クエリを理解できる自然言語処理技術「BERT」を「検索エンジンの歴史において最大の飛躍だ」と述べた。それから2年経った2021年、BERTよりも1000倍ほど精度を増した、最新の検索エンジンが発表された。
テキスト・画像・音声を同時に理解
世界の検索エンジン市場で圧倒的なシェアを誇るグーグルは、MUM(Multitask Unified Model:マルチタスク統一モデル)の開発に取り組んでいる。
「この新技術では、クエリの解釈が劇的に改善され、さまざまなソースをもとにより正確な結果を導き出せる」と語るのは、Insiderの取材に応じたグーグル・サーチ部門長、パンドゥ・ナヤク(Pandu Nayak)だ。
グーグル・サーチ部門長のパンドゥ・ナヤク。
MUMは、テキストや画像、音声といった形式の異なる情報を同時に理解できるマルチモーダルな技術だ。ユーザーはテキストと画像を使った検索が可能になる。
例えば、ある靴の画像を見て「この靴でジョギングできる?」と尋ねたいとする。グーグル検索画面に画像をアップロードし、質問をテキストで打ち込んだり、音声で認識させたりして検索できるようになるとナヤクは言う。
まだ開発段階ではあるが、ナヤクは「近い将来、新機能をリリースできるでしょう。5年以内には披露したい。研究に手応えを感じているので、遠からず実現すると思います」と話す。
長期的には「願わくは5年以内」(ナヤク)の展望で、MUMはユーザーの意図をより正確に把握できるようになる。
2021年度のグーグル年次開発者向け会議(I/O)で、グーグル・サーチ部門チーフであるプラブハカー・ラガバン(Prabhakar Raghavan)は、次のような例を挙げて説明している。
「アダムズ山に登ったので、次の秋には富士山を登りたい。どう備えればいい?」という質問があるとする。現時点では、知りたい情報が得られるまで、異なったトピックでの検索を数回繰り返さなければならない。しかしMUMを採用することで、一度の検索で回答が得られるという。
新型コロナの検索にも
グーグル検索は、ウェブページのリンクのみを羅列した従来の表示方法から、ユーザーにより早く、直接回答を表示するよう徐々にシフトしており、MUMの導入でさらに目覚ましい進歩を遂げることになる。
これまでの取り組みのひとつに「ナレッジパネル」がある。あるトピックを検索した際に、右側上部に情報ボックスが表示され、トピックに関する概要が確認できるものだ。
ナヤクは「MUMを活用すると、有用性の高い、正確な情報をボックス内に表示できる」と期待を寄せる。しかし活用法はそれだけにとどまらず、さまざまな場面で適切な検索結果を整理できるという。
長文で複雑なクエリに対処するには至っていないが、MUMは一部ですでに活用されている。グーグルは2021年6月末、新型コロナウイルスのワクチンに関する検索でMUMを導入し、表示方法が改善されたと発表した。
グーグルの新技術MUMは新型コロナワクチンの検索に役立てられている。
グーグルは対話型の高度な検索を目指しており、MUMは、その壮大な計画の一部にすぎない。AIが自然な会話を交わせるLaMDA技術の開発も進行中だ。
グーグル社内でも賛否両論
これらの新技術で従来の検索モデルから大転換を図ろうという狙いだが、新たな課題に直面してもいる。ナヤクは「MUMに学習させているのは、グーグルが『高品質』と定義したウェブデータのみだ」と言う。
この大規模言語モデルの使用はグーグル社内でも議論が紛糾し、懸念を示した2人のAI倫理研究者が解雇されている。
さらにグーグル検索をめぐっては、クエリの回答を画面最上部に直接表示したり、自社関連ページを表示したりと、ユーザーが別のページに移動するのを阻害しているとして批判を浴びている。しかしナヤクは、次のように反論する。
「MUMはユーザーに対して単に要約した情報を表示するだけでなく、有用なトピックも表示しています。
ユーザーは情報を深く把握することに、大きな価値を見出しています。短い答えでは、複雑なニーズに対応できなくなるでしょう」
(翻訳・西村敦子、編集・常盤亜由子)