OpenAI、著作権保護作品をChatGPTの訓練に使っていることを隠蔽か。バイトダンスのAI研究チームが指摘

OpenAI

REUTERS/Dado Ruvic/Illustration/File Photo

ChatGPTは著作物で訓練を行っていたことを隠蔽しようとしていることが、最新の研究で分かった。

OpenAIのChatGPTを筆頭に、ほぼすべての大規模言語モデル(LLM)は、インターネットからスクレイピングした大量のデータとテキストを使って訓練されている。その中には著作権がまだ有効な書籍も多く含まれている。

ライセンス契約締結などで許可を得て情報に対価を支払うこともせずに著作物を利用しているとして、OpenAIにはますます厳しい目が向けられている。このことで、著作者らから訴訟も起きている

これに対してOpenAI、グーグル(Google)、メタ(Meta)、マイクロソフト(Microsoft)などは、主に自社のAIモデルが訓練に使用したデータの内容開示を停止するという対応をしている。

だが現在、OpenAIはさらに一歩踏み込んでいることを最新の研究資料が示唆している。

『ハリー・ポッター』で試すと…

あわせて読みたい

Popular