こんにちは。パロアルトインサイトCEO・AIビジネスデザイナーの石角友愛です。今年ももうすぐ終わりですので、2022年のAI業界のトレンドを総まとめしたいと思います。
画像生成AIの1年
オープンソースの画像生成AI「Stable Diffusion」で描いた浮世絵タッチのユニコーンの絵。
Business Insider Japan
今年最も話題となり、印象的だったのは「画像生成AI」の台頭ではないでしょうか。
これは、人間がプロンプトと呼ばれるテキストでAIへ指示を出し、その指示に従った画像をAIが自動で生成する技術です。
そんな画像生成AIのハイライトを時間軸でまとめてみたいと思います。
2022年4月〜5月 OpenAI「DALL・E 2」 / グーグル「Imagen」公開
OpenAIが開発した画像生成AI「DALL・E 2」が公開されると、生成された画像がとてもアーティスティックだと世間の注目を集めました。それに続くようにグーグルも画像生成AI「Imagen」を開発し、生成された画像の質が「DALL・E 2」より優れているのではないかといった議論を巻き起こすなど、こちらも話題を呼びました。
※DALL・E 2は発表当初はBeta版の限定的な公開で、Imagenは非公開だった
筆者が経営するパロアルトインサイトのCTOがDALL・E 2のベータ版招待を受けて作成したアート「皆で勉強している風景〜サイバーパンク風〜」
出典:パロアルトインサイト
2022年7月 ミッドジャーニー社「Midjourney」公開
MidjourneyはAIの研究者や開発者だけでなく、13歳以上なら一般の人でも自由に利用でき、かつ25回という限られた回数であれば無料で使えることから瞬く間に大人気になりました。
TwitterやInstagramなどのSNS上で数多くのAIアート作品が投稿され非常に注目を集めました。また、開発を担当したMidjourney社は少数精鋭の小規模企業ながら黒字化にもいち早く成功しており、経営の観点からも注目です。
Midjourneyで生成した、桜を見る少年 葛飾北斎風の絵(指示語は「A boy watching cherry blossoms Katsushika Hokusai style」
2022年8月:Stability AI社「Stable Diffusion」公開
2022年8月:Stability AI社「Stable Diffusion」公開
2022年8月22日に全世界へ公開されたStable Diffusionは、オープンソースで作られたことが大きな特徴でした。
Stable Diffusionの機械学習モデルは、ライセンスを明記すれば営利・非営利を問わず使用できます(ただし、法律に違反するもの・武器などの人に危害を加えるもの・誤った情報を拡散する恐れがあるものなどで利用することは禁止)。
このため、開発に対する門戸が一気に広がり、秋以降にはデザインツールのCanva上で画像生成機能が実装されたり、もともと小説の自動生成AIであったNovelAIから派生して二次元イラストに特化したNovelAI Diffusionが生まれるなど、同種の画像生成AIが次々と登場しています。
日本でも、「AIピカソ」というスマートフォンアプリが発表され、最近では同社が「いらすとや」と提携した「AIいらすとや」が無料Appランキング1位にランクインするなど、引き続き話題に事欠かない分野となりそうです。
画像生成AIの今後の課題と新しいビジネスモデル
画像生成AIにより誰でも簡単にアーティスティックな画像が作成できるようになった背景には、画像生成AIがインターネット上の画像や写真、絵画を大量に学習した過程があります。
そして、その学習データには歴史的な絵画だけでなく現在活躍中のアーティストの絵も含まれているため、アーティストたちは画像生成AIに自分の作品が模倣されるリスクにさらされることになってしまいました。
実際に、インターネットで現役のアーティストの名前を検索すると、本人が描いたのではない作品も表示されることが増えてきています。そこで、アーティスト側もAIに対抗する動きを始めています。
例えば、Stable DiffusionやMidjourneyなどの学習に使われた58億枚の画像の中に自分の作品が含まれているかどうかを検索することができる「Have I Been Trained?」というサイトもオープンしました。こうしたサイトによって、アーティストがAI企業に使用の取りやめなどを訴え出る際の助けになることが予想されます。
「Have I Been Trained?」で学習画像が探せる仕組み:Stable Diffusionなど一部の生成系AIは画像データセット「Laion-5B」および「Laion-400M」などを学習に使用したとされます。これらの画像データセットの内容を検索することで、自分の作品が学習に使われたかどうかを調べられます。
Have I Been Trained?の検索ページ。「人気の画像生成AIモデルの学習に使用された58億枚の画像を検索できます」と書かれている。
一方で、ストック素材大手Shutterstockはアメリカ時間の10月25日にOpenAIとの提携を拡大すると発表しました。
OpenAIの画像生成AIシステム「DALL・E 2」をShutterstockのコンテンツと統合し、ユーザーが利用できる画像生成AIツール「Shutterstock.AI」を提供することを明らかにしました。実は、2021年頃から、Shutterstockは保有する大量の画像データをOpenAIのDALL・E 2へ学習データとしてライセンスしており、両社は協力関係にありました。
OpenAIのCEOであるサム・アルトマンは、「Shutterstockからライセンスを受けたデータは、DALL・E 2のトレーニングに不可欠なものでした」と述べた上で、「我々は、人工知能がアーティストの創造的なワークフローに不可欠な要素となることや、将来のコラボレーションが生まれることを楽しみにしています」と未来への期待を語りました。
同時に、Shutterstockは「Contributer Fund(貢献者ファンド)」の設立も発表しました。これは、DALL・E 2の学習のために提供していた画像を作成したアーティストたちに対して、同社が報酬を支払うという内容です。
具体的には、Shutterstock社が「Shutterstock.AI」によって生成された画像を販売する場合、そのAIを学習させるために使用された画像の生みの親であるすべてのアーティストが報酬を得るというもので、アーティストが受け取る金額は、自分の画像が訓練データセットにどれだけ含まれていたかに基づいて決定されます。
このファンドについて、Shutterstock社の最高経営責任者であるポール・ヘネシー氏は、
「創造性を表現する媒体は、常に進化し拡大しています。この進化を受け入れ、イノベーションを推進する生成テクノロジーが倫理的慣行に基づいて使用されることを保証する体制を構築することは、我々の大きな責任であると認識しています」
と述べています。
OpenAIは2022年の年末ぎりぎりまで、新サービスのリリースで話題になっています。12月にローンチし、いま世界中で話題になっているChatGPTもその1つです。その能力について、ニューヨーク・タイムズのテクノロジーライターであるKevin Roose氏は「ChatGPTは、端的に言ってこれまで一般に公開された人工知能チャットボットの中で最高のものだと言えます」と述べて絶賛しています。
同氏の記事によると、過去10年間のAIチャットボットは大きな進化を遂げておらず、近年になってようやく「マーケティングコピーを書く」というような特定のタスクをこなすのに長けたツールが生まれたものの、専門領域から外れたタスクでは使い物にならないようなケースがほとんどであったといいます。
ところが、ChatGPTは従来のツールとは一線を画す「賢くて奇妙かつ柔軟なツールである」と紹介されています。
ChatGPTが「よくできた対話AI」であることは間違いありませんが、一方、どこまで有用なのか、出力するテキストが正確なのかは議論の余地があります。
自動運転の2022年
Motionalが2023年にサービス開始予定のロボットタクシー。ベース車両は韓国・ヒョンデの電気自動車「IONIQ5」。
出典:Motional
2022年は、今までの技術にさらに磨きがかかり、実用度が増したケースも多く見受けられました。例えば自動運転もその一つです。
アメリカのボストンに拠点を持つMotional(モーショナル)は12月、Uberと提携し、2023年にラスベガスでロボットタクシーサービスを開始すると公表しました。ユーザーはUberアプリにアクセスしてUberXまたはUber Comfort Electricオプションを選択することで、Motional社の自動運転車両を呼び出すことができるようになるとしています。既存のUberアカウントで支払いを行うことも可能です。
車両は完全自動運転ですが、当面はMotionalのセーフティドライバーが乗車した上で、さらに遠隔操作チームによる監視を行う体制で運用される予定です。2023年にはセーフティドライバーなしの無人走行を目指しているということです。
同様に、もともとグーグル(アルファベット社)の自動運転プロジェクトとしてスタートし、分社化して誕生したWaymoは11月、完全なドライバーレスサービスをサンフランシスコで開始し、そのサービスを有料化することを発表しました。Waymoの技術は、信号や標識を認識したり、歩行者や自転車を検出したりすることも可能です。
Waymoのドライバーレスの自動運転車両。
出典:Waymo
2022年の自動運転技術はトラックなどの物流分野でも展開が進みました。カナダ発の自動運転テクノロジーカンパニーであるWaabiは、11月に第1世代の自動運転トラックを発表しました。このトラックは、安全で信頼性の高い自動運転体験を提供するために、一連のセンサー、高度なソフトウェア、人工知能を搭載しており、自動車線維持、自動ブレーキ、障害物回避など、高度な運転サポートシステムを多数備えているということです。
ロボットとAI
アマゾンが発表した新型のピッキングロボットアーム「Sparrow」。11月に記者向けに公開した。
撮影:小林優多郎
自動運転同様、今年多くのニュースになったのがロボット領域です。例えば、今年11月に発表されたSparrowは、アマゾンの新しい人工知能ロボットシステムです。
梱包される前に個々の商品を仕分けることでフルフィルメントプロセスを合理化するものとして作られました。コンピュータービジョン(画像認識)とAIを活用して作られており、数百万個の商品を認識し、処理できることが特徴です。アマゾンのブログには「ロボットテクノロジーは、効率的で安全な作業を実現するために、人間がハードではなくスマートに働くことを可能にします」と書かれています。
ロボットの発表でいうと、テスラが10月に開催した第2回AI Dayで、CEOのイーロン・マスクが発表したOptimus(オプティマス)というロボットのプロトタイプも話題になりました。
テスラの人型ロボット「オプティマス」のプロトタイプ。
出典:Tesla AI Event 2022より
テスラは、オプティマスの競合他社に対する優位性として、テスラの運転支援システム「フルセルフドライビング」で培った技術による自立航行能力と、自動車部門で培った製造上のコスト削減能力を挙げています。
テスラのようにAIを積極的に活用する企業が横展開をしながらロボット産業に参入することでコスト競争力が高くなり、ロボットがより低価格になる未来が予想できます。マスク氏はOptimusが大量生産された場合、本体価格が3〜5年間の間におそらく2万ドル以下になるだろうと発表しており、ロボットが身近な存在となる日はそう遠くないのだと思わされるプレゼンテーションでした。
ロボットはアメリカ以外でも盛り上がっています。例えば、アメリカのテクノロジーメディア「The Information」が「2022年注目のスタートアップ50社」の、アジアカテゴリーで1位に選んだのが、中国のスタートアップBang Bang Roboticsです。
同社は身体障害者や高齢者向けの電動車椅子やリハビリテーションロボットを開発しています。2022年の売上高は3倍になると期待されていて、売り上げ比率の35%が海外市場という点も高く評価されました。
そして何より、プロダクトのデザインが非常に可愛らしく、従来の車椅子とは違った魅力が詰まっている点が特徴的です。このスタートアップは、約20カ国で1万台以上を販売し、国際特許を含む約110件の特許を取得しています。国内のリハビリ・移動支援市場は、中国の高齢化により年率5〜10%のペースで成長すると予想されています。
同社の公式サイトに掲載されているプロダクトの画像。
出典:Bang Bang Robotics
このように、2022年はAI業界も大きく動いた年でした。
他にもたくさんのイベントがありましたが、やはり皆さんにとって一番身近だったのはご紹介した画像生成AIや文章生成AI、そして動画生成AIなどだったのではないでしょうか。
今後、法整備などが進むことで、仕事でもより積極的な生成AIの活用が進み、クリエイティブな仕事や情報を統合する仕事に人間がより時間を割くようになるのではないでしょうか。