米AI企業OpenAIの技術を活用したチャットや画像生成など新たな機能を搭載したマイクロソフト(Microsoft)の検索エンジン「Bing(ビング)」。その学習と成長に使用される記事や画像の対価は一体どうなっているのか。
Microsoft
グーグル(Google)やマイクロソフト(Microsoft)が対話型人工知能(AI)を統合した次世代検索エンジン市場の覇権争いを繰り広げる中、メディア各社は巻き添えを食った上に大損を被るのではと不安を募らせている。
そして、少なくとも報道機関1社はすでに複数のテック企業と対価の支払いをめぐって交渉を開始している。
米メディア大手ニューズ・コープ(News Corp)のロバート・トムソン最高経営責任者(CEO)は3月7日の投資家向け説明会で、匿名のテック企業1社との交渉を開始したことを明らかにし、AIエンジンの学習データとしてメディアのコンテンツを使用する場合は提供元に対価を支払うべきとの見解を示した。
ニューズ・コープは、ウォール・ストリート・ジャーナル(Wall Street Journal)を発行するダウ・ジョーンズ(Dow Jones)を傘下に持ち、テック企業がパブリッシャーの提供するコンテンツを呼び水に(広告など)サービスを展開する際には相応の対価を支払うべきと、長らく先頭に立って声を上げてきた。
グーグルやマイクロソフトの対話型AIは、パブリッシャーなどが制作・公開したコンテンツをデータとして学習し、検索ユーザーの質問に対応した回答を対話形式で提供する仕組みだ。
そうした新たな技術と突如向き合わざるを得なくなった報道機関やメディア企業もしくは組織団体はいま、自社のコンテンツがどう使われているのか、いないのか、使われている場合はどうすれば正当な対価を確保できるのか、至急の対応を迫られている。
パブリッシャーの中には、対話型AIの登場をインターネットの黎明期になぞらえ、業界にとって最も破壊的な変化であり、その脅威を業界存亡の危機と捉えているところもある。
パブリッシャーの懸念の核心にあるのは、対話型AIを通じて質問に対する詳細な回答が得られるようになれば、もはやコンテンツサイトに遷移してまで閲覧する必要がなくなり、現時点ですでにデジタルシフトの影響に苦しんでいるメディア企業の収益モデルが完全に崩壊するのではないかということだ。
ニューヨーク・タイムズ(New York Times)なども加盟するパブリッシャーの業界団体ニュース/メディアアライアンス(News/media alliance)のエグゼクティブバイスプレジデント兼最高法務責任者、ダニエル・コフィーはこう語る。
「AIは大きなチャンスをもたらす新たなフロンティアとは言え、質の高いジャーナリズムの信頼性、独立性、健全性を丸ごとAIに代理させるというわけにはいかないのです。正当な対価が支払われなければ、ジャーナリストの存在によってストーリーに吹き込まれていた人間性の部分が失われることになります」
メディア企業では、経営幹部から取締役会まで、トップレベルの議論はこの話題で持ち切りだ。
複数の関係者によると、パブリッシャーの経営幹部らはすでに敵味方を問わず同業他社と対策を練っているところで、団結してテック企業に対して断固たる立場をとる方針という。
ニュース/メディアアライアンスと同様、ワシントン・ポスト(Washington Post)やフィナンシャル・タイムズ(Financial Times)が加盟するデジタルコンテントネクスト(Digital Content Next)などの業界団体も、この問題を注視する。加盟企業のコンテンツを学習データに使う対話型AIがどんな影響をもたらすのか調査を進めつつ、協調してどんな対応をすべきか検討している模様だ。
裁判に発展する可能性が極めて高い
パブリッシャー関係者2人に取材したところ、不可避とは言わないまでも、訴訟に発展する可能性が極めて高いとの見方だった。
ゲッティイメージズ(Getty Images)がジェネレーティブAIを手がけるStability AI(スタビリティーエーアイ)を著作権侵害の疑いで訴えた裁判(デラウェア地区連邦地裁)や、AIシステムにより生成された(芸術)作品は著作権保護の対象にならないとの判断を米著作権局が示した「セアー対パールマター」裁判(コロンビア特別区連邦地裁)が先行事例となる。
メディア企業側は、対話型AIによるコンテンツのスクラッピング(=保存して商業利用する行為と解釈できる)がサービス利用規約に違反するとの主張が可能だ。
さらに、対話型AIの回答はパブリッシャーが提供する情報から生成されたものであり、もしパブリッシャーのビジネスを破壊してしまえば、対話型AIは自ら学習データとして利用する良質なニュースの提供元を失うことになり、本末転倒ではないかと主張することもできるだろう。
ただし、(批評や教育、ニュース報道などで)特定の方法による場合には著作権で保護されたコンテンツの利用を認める「フェアユース」の原則が存在するため、メディア各社は多少の苦戦を強いられることになるかもしれない。
また、テック企業側が、対話型AIを介在させることで全く新しいコンテンツを創り出しているとの主張を展開する可能性も考えられる。
一方、メディア側は新たな法制度による解決を目指すこともできなくはないが、実際に法律の発効に至るまでには何年もの時間が必要になると思われる。
関係者の共通認識として、パブリッシャーにとって望ましい帰結は、コンテンツを使用するためのライセンス契約をテック企業と結ぶことであり、間もなくそのような形で物事が動き出すとみられる。
前例のない話ではなく、パブリッシャーは以前からライセンス契約を介してコンテンツの使用を許可してきた。AI関連の領域でも、イメージ素材大手シャッターストック(Shutterstock)が最近、ジェネレーティブAIのモデル学習に貢献したアーティストのIP(知的所有権)に対価を支払う基金を設立すると発表している。
国際法律事務所クラーク・ヒル(Clark Hill)でメディアやテック分野のクライアントを担当するミライア・ヤウォルスキーはこう指摘する。
「売上高の減少、サブスクリプションの増加、存在感を増す(サードパーティの)コンテンツアグリゲーターなど、パブリッシャーやメディア企業はなぶり殺し状態が続いています。売り上げを分け合う必要があるし、そうなると信じるしかありません」
パブリッシャー側からは、AIの学習データとして使われないよう、コンテンツを検索の対象から外す案も出てきている。
「我々のコンテンツをはいどうぞとばかりに引き渡して、それを学習データに使った言語モデルなりAIなりのせいで自分たちが廃業に追い込まれる、そんな馬鹿な話があるでしょうか?」(パブリッシャー関係者)
AI企業に対価を支払わせるのが簡単ではない理由
AIのコンテンツ利用に懸念を示しているのはパブリッシャーだけではない。他の業種の企業やクリエイターたちからも、Stability AI(前出)のようなジェネレーティブAIを提供する企業のコンテンツ不正利用に対する批判の声が上がっている。
前出ニューズ・コープのロバート・トムソンはこう語る。
「AIエンジンは学習を経て、プロフェッショナル性をさらに高めようと、よりプロフェッショナル性の高いコンテンツを使うようになってきています。オープンソースを口実にする人たちもいますが、それらがIP(知的所有権)を包含する著作権で保護されたコンテンツを利用していることは明らかで、それゆえ一定の対価が支払われる必要があるのです。
とりわけ、ビジネス分野を例に取るなら、AIエンジンの専門性が高まるとすれば、それは(経済・金融の専門情報を提供する)ダウ・ジョーンズのコンテンツがデータとして使われた結果であることはまず間違いありません。
結局、ユーザーはAIを通じて記事に触れているわけで、その点において対価が発生すべきなのです」
そうは言っても、そこにはややこしい問題がある。
何より、パブリッシャーは自社のどのコンテンツがどのような目的でAIに利用されているのか、まだ正確に把握し切れていない。
そして、対話型AIは次々と登場しており、パブリッシャーの対応ももぐら叩き状態になってしまっている。
例えば、マイクロソフトの検索エンジン「Bing(ビング)」であれば、同社を攻めるか、それともその基盤技術である大規模言語モデル「GPT-4」を提供するOpenAIを攻めるべきか、パブリッシャー側が判断しないといけない。
マイクロソフトがテック専門メディアのワイアード(Wired)に答えたところによると、GPT-4を搭載するBingは、マイクロソフトのニュースサービスと契約を結んでいるパブリッシャーの有料コンテンツを学習データに活用している。
一方、OpenAIが学習データとしての利用時に、さまざまなコンテンツの逐一に対してライセンス料を支払っているかどうかは明らかにされていない。
Insiderを含む多くのメディアで、ChatGPTの生成した回答にクリエイターの作品を無断で盗用した形跡が見られることはすでに明白になっている。
現時点ではベータ版として提供されている最新版Bingの対話型AI検索のサンプル回答を見ると、情報の参照元であるパブリッシャーのサイトへのリンクが表示されており、少なくともパブリッシャーに(ページビューなど)トラフィックをもたらす期待はある。
しかし、最終の一般公開バージョンにリンクが組み込まれるのか、また実際の運用時にリンクがどの程度のトラフィックをもたらすのかは相変わらず不明なままだ。
パブリッシャーの中には、そうしたトラフィック増加により得られるバリューが、果たしてパブリッシャーのコンテンツから対話型AIのほうが(学習データとして)得るバリューと釣り合うのか、疑問視する声もある。
マイクロソフトの広報担当はInsiderの取材に対し次のようなコメントを寄せた。
「Bingは、ユーザーが情報を探しやすくするために、著作権法および知的財産権法に準拠して、ウェブ上で公開され利用可能な情報を収集し、検索結果の生成に充当しています。(対話型AIを使った)新たな機能についても、ユーザーが関連するウェブサイトを閲覧できるようリンクや参照情報を表示するなど、法準拠など上記の指針を維持する考えです。
現在はプレビューとしての提供ですが、その間もパートナーと協力し、追加的なコントロールが必要か、必要であればどんな形が有効かを検討しており、今後さらなる詳細をお伝えしていく予定です」
同じく対話型AI「Bard(バード)」の開発を進めるグーグルも、学習データとしてウェブ上の情報を活用するとしている。なお、同社が2月6日に試験提供の開始を発表した際のデモ映像を見る限り、サンプル検索結果に情報参照元へのリンクは含まれていなかった。
「御社のトラフィック増加につながる」は通用しない
ウェブ上のコンテンツを学習データとして利用した対話型AIの台頭が、パブリッシャーにとって近年最大の脅威と見なされる背景には、検索やソーシャル経由のトラフィック獲得を優先してテック企業のビジネスモデルに適応した失敗を繰り返すまいというパブリッシャー側の強い思いがある。
目の前のことだけを考えて妥協的な判断をすれば、テック企業側が戦略転換を図った時に犠牲になるのは結局パブリッシャー側、との認識がそこにはある。
Insiderの親会社である独アクセル・シュプリンガー(Axel Springer)などメディア企業は、AIが自社コンテンツにもたらす影響への対策を検討し続けてきた。ロボットでは簡単に再現できない調査報道やニュース分析に重点を置いたコンテンツ作りはその一例だ。
また、対話型AIの台頭により検索がコンテンツの配信・拡散手法として有効に機能しなくなった場合、どんな手段でコンテンツを配信・拡散するかもメディア企業は検討している。ニュースレターやプッシュ通知を重視する展開も考えられるだろう。
AIの台頭に身構えるだけでなく、バズフィード(BuzzFeed)やスポーツ・イラストレイテッド(Sports Illustrated)親会社のアリーナ・グループ(Arena Group)のように、一部のコンテンツ作成にAIを活用すると早々と宣言するメディア企業も出てきている。
いずれにしても、検索結果にコンテンツの抜粋なり要約なりが表示される場合に対価を求める取り組みは、今回の対話型AIをめぐる問題が初めてというわけではない。
リンクによるトラフィック創出だけでなく、テック企業がパブリッシャーにコンテンツ使用料を支払う前例も出てきている。
フェイスブック(Facebook)は数年前にモバイルアプリ向けのニュースタブを設置し、表示するコンテンツの発行元と契約して使用料を支払っている。
ウォール・ストリート・ジャーナル(2022年7月29日付)によれば、アメリカではパブリッシャーとの契約を打ち切って取り組みの継続を断念した模様だが、イギリスなどではアルゴリズムベースのニュースキュレーションが同タブで続いている。
また、フェイスブックはフランスのパブリッシャー業界団体(APIG)と複数年契約を結び、ユーザーがプラットフォーム上で共有した記事に対して対価を支払うことで合意した。
一方、グーグルは2020年からメディア企業との対立解消を目指し、独週刊誌デア・シュピーゲル(Der Spiegel)などを皮切りに、ライセンス契約に基づくコンテンツ使用料の支払いを開始。フランスでは使用料が安すぎるとして競争当局から罰金を科されるなど、試行錯誤が続いている。
アメリカでは、報道機関が記事などコンテンツを配信する大手テック企業と団体交渉できるようにする「ジャーナリズム競争・保護法案」が議会で検討中だ。
ロイター記事(2022年12月5日付)によれば、フェイスブックの親会社メタ・プラットフォームズ(Meta Platforms)は法案が議会で可決された場合、ニュース配信そのものを停止する検討を始めると明言し、非賛同の姿勢を示している。