2022年はAI技術の「社会実装」が躍進した1年…ChatGPT、神絵AI、自動運転からロボットまでを振り返る

こんにちは。パロアルトインサイトCEO・AIビジネスデザイナーの石角友愛です。今年ももうすぐ終わりですので、2022年のAI業界のトレンドを総まとめしたいと思います。

画像生成AIの1年

unicorn

オープンソースの画像生成AI「Stable Diffusion」で描いた浮世絵タッチのユニコーンの絵。

Business Insider Japan

今年最も話題となり、印象的だったのは「画像生成AI」の台頭ではないでしょうか。

これは、人間がプロンプトと呼ばれるテキストでAIへ指示を出し、その指示に従った画像をAIが自動で生成する技術です。

そんな画像生成AIのハイライトを時間軸でまとめてみたいと思います。

2022年4月〜5月 OpenAI「DALL・E 2」 / グーグル「Imagen」公開

OpenAIが開発した画像生成AI「DALL・E 2」が公開されると、生成された画像がとてもアーティスティックだと世間の注目を集めました。それに続くようにグーグルも画像生成AI「Imagen」を開発し、生成された画像の質が「DALL・E 2」より優れているのではないかといった議論を巻き起こすなど、こちらも話題を呼びました。

※DALL・E 2は発表当初はBeta版の限定的な公開で、Imagenは非公開だった

image2

筆者が経営するパロアルトインサイトのCTOがDALL・E 2のベータ版招待を受けて作成したアート「皆で勉強している風景〜サイバーパンク風〜」

出典:パロアルトインサイト

2022年7月 ミッドジャーニー社「Midjourney」公開

MidjourneyはAIの研究者や開発者だけでなく、13歳以上なら一般の人でも自由に利用でき、かつ25回という限られた回数であれば無料で使えることから瞬く間に大人気になりました。

TwitterやInstagramなどのSNS上で数多くのAIアート作品が投稿され非常に注目を集めました。また、開発を担当したMidjourney社は少数精鋭の小規模企業ながら黒字化にもいち早く成功しており、経営の観点からも注目です。

image3

Midjourneyで生成した、桜を見る少年 葛飾北斎風の絵(指示語は「A boy watching cherry blossoms Katsushika Hokusai style」

2022年8月:Stability AI社「Stable Diffusion」公開

2022年8月:Stability AI社「Stable Diffusion」公開

2022年8月22日に全世界へ公開されたStable Diffusionは、オープンソースで作られたことが大きな特徴でした。

Stable Diffusionの機械学習モデルは、ライセンスを明記すれば営利・非営利を問わず使用できます(ただし、法律に違反するもの・武器などの人に危害を加えるもの・誤った情報を拡散する恐れがあるものなどで利用することは禁止)。

このため、開発に対する門戸が一気に広がり、秋以降にはデザインツールのCanva上で画像生成機能が実装されたり、もともと小説の自動生成AIであったNovelAIから派生して二次元イラストに特化したNovelAI Diffusionが生まれるなど、同種の画像生成AIが次々と登場しています。

日本でも、「AIピカソ」というスマートフォンアプリが発表され、最近では同社が「いらすとや」と提携した「AIいらすとや」が無料Appランキング1位にランクインするなど、引き続き話題に事欠かない分野となりそうです。

画像生成AIの今後の課題と新しいビジネスモデル

画像生成AIにより誰でも簡単にアーティスティックな画像が作成できるようになった背景には、画像生成AIがインターネット上の画像や写真、絵画を大量に学習した過程があります。

そして、その学習データには歴史的な絵画だけでなく現在活躍中のアーティストの絵も含まれているため、アーティストたちは画像生成AIに自分の作品が模倣されるリスクにさらされることになってしまいました。

実際に、インターネットで現役のアーティストの名前を検索すると、本人が描いたのではない作品も表示されることが増えてきています。そこで、アーティスト側もAIに対抗する動きを始めています。

例えば、Stable DiffusionやMidjourneyなどの学習に使われた58億枚の画像の中に自分の作品が含まれているかどうかを検索することができる「Have I Been Trained?」というサイトもオープンしました。こうしたサイトによって、アーティストがAI企業に使用の取りやめなどを訴え出る際の助けになることが予想されます。

「Have I Been Trained?」で学習画像が探せる仕組み:Stable Diffusionなど一部の生成系AIは画像データセット「Laion-5B」および「Laion-400M」などを学習に使用したとされます。これらの画像データセットの内容を検索することで、自分の作品が学習に使われたかどうかを調べられます。

image4

Have I Been Trained?の検索ページ。「人気の画像生成AIモデルの学習に使用された58億枚の画像を検索できます」と書かれている。

一方で、ストック素材大手Shutterstockはアメリカ時間の10月25日にOpenAIとの提携を拡大すると発表しました。

OpenAIの画像生成AIシステム「DALL・E 2」をShutterstockのコンテンツと統合し、ユーザーが利用できる画像生成AIツール「Shutterstock.AI」を提供することを明らかにしました。実は、2021年頃から、Shutterstockは保有する大量の画像データをOpenAIのDALL・E 2へ学習データとしてライセンスしており、両社は協力関係にありました。

OpenAIのCEOであるサム・アルトマンは、「Shutterstockからライセンスを受けたデータは、DALL・E 2のトレーニングに不可欠なものでした」と述べた上で、「我々は、人工知能がアーティストの創造的なワークフローに不可欠な要素となることや、将来のコラボレーションが生まれることを楽しみにしています」と未来への期待を語りました

同時に、Shutterstockは「Contributer Fund(貢献者ファンド)」の設立も発表しました。これは、DALL・E 2の学習のために提供していた画像を作成したアーティストたちに対して、同社が報酬を支払うという内容です。

具体的には、Shutterstock社が「Shutterstock.AI」によって生成された画像を販売する場合、そのAIを学習させるために使用された画像の生みの親であるすべてのアーティストが報酬を得るというもので、アーティストが受け取る金額は、自分の画像が訓練データセットにどれだけ含まれていたかに基づいて決定されます。

このファンドについて、Shutterstock社の最高経営責任者であるポール・ヘネシー氏は、

「創造性を表現する媒体は、常に進化し拡大しています。この進化を受け入れ、イノベーションを推進する生成テクノロジーが倫理的慣行に基づいて使用されることを保証する体制を構築することは、我々の大きな責任であると認識しています」

と述べています。

OpenAIは2022年の年末ぎりぎりまで、新サービスのリリースで話題になっています。12月にローンチし、いま世界中で話題になっているChatGPTもその1つです。その能力について、ニューヨーク・タイムズのテクノロジーライターであるKevin Roose氏は「ChatGPTは、端的に言ってこれまで一般に公開された人工知能チャットボットの中で最高のものだと言えます」と述べて絶賛しています

同氏の記事によると、過去10年間のAIチャットボットは大きな進化を遂げておらず、近年になってようやく「マーケティングコピーを書く」というような特定のタスクをこなすのに長けたツールが生まれたものの、専門領域から外れたタスクでは使い物にならないようなケースがほとんどであったといいます。

ところが、ChatGPTは従来のツールとは一線を画す「賢くて奇妙かつ柔軟なツールである」と紹介されています。

ChatGPTが「よくできた対話AI」であることは間違いありませんが、一方、どこまで有用なのか、出力するテキストが正確なのかは議論の余地があります。

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み