2023年9月、セールスフォース(Salesforce)の年次イベント「ドリームフォース(Dreamforce)」で基調講演したマーク・ベニオフ最高経営責任者(CEO)。
Salesforce
ジェネレーティブ(生成)AIに関心を抱く企業に向けて、セールスフォース(Salesforce)のマーク・ベニオフ最高経営責任者(CEO)が伝えたいメッセージは単純明確だ。
そのテクノロジーは現時点ではまだ信頼に値しない、セールスフォースの販売する製品を除いては——。要するにそういうことだ。
9月12〜14日に米サンフランシスコで開催された同社の年次カンファレンス「ドリームフォース(Dreamforce)」に参加してきた。
イベントが終了した現在、公式ウェブサイトには、同社が革新に挑戦する先駆者を指して使う「Trailblazer(トレイルブレイザー)」のスペリングを「TrAIlblazer」と強調して参加者への感謝を伝えるテキストが掲載されているが、そんな細工からも分かるように、カンファレンスはAIに偏重した内容だった。
クラウドベースの顧客関係管理(CRM)ソフトウェアを開発・販売するセールスフォースだが、2023年のドリームフォースは当初から「世界最大のAIイベント」とうたい、直前に「世界初、CRMに特化した生成AI」製品の「Einstein 1 Platform(アインシュタイン・ワン・プラットフォーム)」を発表していた。
ベニオフ氏はカンファレンスの大半をジェネレーティブAIの危険性について不気味な警告を発することに費やし、一方で同時に、セールスフォースが開発した新たなテクノロジーがいかに高い倫理性を誇り安全であるかを喧伝した。
サンフランシスコ市内の会場で講演したベニオフ氏は、会場に招いた著名人や政治家、OpenAIのサム・アルトマンCEO含むビジネスリーダーらに向かって、AIに膨大な量の個人データを学習させる行為が孕(はら)む現実のリスクについて、それぞれの抱く懸念を広く社会に発信してほしいと働きかけた。
その上で、ベニオフ氏は会場に集まった人々に対し、セールスフォースがデータの取り扱いについて倫理と責任の両面で高い基準を設定していることを強調するのを忘れなかった。
カンファレンスに2日間参加してそうした話を聴いた後、私には根本的な疑問が芽生えてきた。
著作権で保護されたデータを同意なしに使ってAIを学習させている競合他社とは一線を画し、セールスフォースの大規模言語モデル(LLM)だけは問題のある挙動を見せることはないと、ベニオフ氏はなぜ断言できるのだろうか。その根拠は?
私は9月13日の午後、ベニオフ氏に会場で直接尋ねてみた。彼はこう語った。
「私たちの大規模言語モデルは、インターネット(上のコンテンツ)をスクラップして学習させるということをしていないからです。これで答えになっているでしょうか?」
ベニオフ氏の説明によれば、セールスフォースはLLMの開発について、フィロソフィーを公開している(編集部注:「信頼される生成AI開発のためのガイドライン」を指すとみられる)。
同社のLLMには、既存のモデルを拡張する形で開発するものもあれば、ゼロから構築するものもある。
例えば、2022年にリリースした対話型AI向けLLM「CodeGen(コードジェン)」は、セールスフォース専用のプログラミング言語「Apex(エイペックス)」を使ってゼロからトレーニングしたモデルだという。
「あくまで当社のコアシステムの内部にあるもので、コンピューターが(外部のデータから)生成するものではないのです」(ベニオフ氏)
ベニオフ氏は2018年に米メディア大手メレディス(Meredith)からニュース誌「タイム(Time)」を夫妻名義で買収しており、著作権侵害には徹底抗戦の立場だ。
彼は私の取材にこう語った。
「メディアのオーナーとしては(著作権侵害は)大きな問題です。自分で大規模言語モデル(を基盤技術とする生成AI)を使っていて、タイム誌に由来するテキストやイメージを見つけたら、『ちょっと待ってくれ、これはウチのコンテンツじゃないか』と思うのは当然ですよね?」
「メディア企業もようやく目を覚まし、自分たちの情報がたくさん盗まれていることに気づき始めています。おそらくあなたのところ(Insider)の情報もですよ」
ベニオフ氏が本気で言っているのかふざけているのか真意をつかみかねていると、同席していた倫理AIプラクティス担当プリンシパルアーキテクトのキャシー・バクスター氏が口を挟んだ。
バクスター氏の説明によれば、セールスフォースはAIモデルのトレーニングに際し、同意を得ていることを確認済みの顧客データのみを使用するとともに、いかなるオープンソースのデータを使う場合でも事前に法的レビューを実施しているという。
「私たちは自社開発しているすべてのAIモデルに自負を抱いています。当社でトレーニングに使用している全てのデータについて透明化が図られていると断言できますし、著作権で保護されたものは一切使っていないことを確認いただけるようになっています」