ChatGPTを制作したOpenAIは画像生成AIのDALL-E、ほかにもWhisper、CodexなどのAIツールを有している。
OpenAI
- OpenAIは人工知能チャットボット「ChatGPT」を開発したスタートアップだが、同社は他にもアプリケーションを開発している。
- 画像生成AI「DALL-E」は、人が入力した文章をもとに画像を作成する。
- 「Whisper」は音声認識モデルで、多くの言語の音声をテキストに起こして翻訳する。
ChatGPTは2022年11月のリリース後、瞬く間に大流行した。しかしChatGPTを開発したスタートアップOpenAIは、他にもAI製品も有している
例えば、ChatGPTをリリースしたわずか数カ月前、OpenAIはアート画像生成AIであるDALL-Eのウェイティングリストを削除し、すぐに1日の利用者が150万人を超えるまでに成長した。このツールは、アーティストの間で論争を巻き起こし、このような画像生成AIが、クリエイティブな仕事をする人たちにとって何を意味するのかが議論された。
DALL-Eと同様に、ChatGPTも論争を巻き起こし、グーグル(Google)やマイクロソフト(Microsoft)といった大手テック企業がより強力なAIツールを開発する競争を始めるきっかけにもなった。OpenAIは現在、ChatGPTよりも「より強力」なAIチャットボットを搭載したBingの新バージョンでマイクロソフトとコラボしている。OpenAIの他の製品同様、新しいBingは独自のドラマを創り出している。
ChatGPTによるOpenAIの成功は今のところ止められないようだ。ここでは、OpenAIの他のAI製品を見てみよう。
DALL-E
「宇宙空間の海を泳ぐ宇宙飛行士の魚、デジタルアート」とテキストを入力し、DALL-Eが生成した画像。
DALL·E/OpenAI
ChatGPTが発表されるわずか数カ月前に、OpenAIはアート画像生成AIであるDALL-Eのウェイティングリストを削除し、瞬く間に1日の利用者数が150万人を超えるまでに成長した。
DALL-Eはテキストを受け取って、想像力豊かで詳細なアートワークを素早く作成するものだが、アーティストたちの間で論争が巻き起こり、DALL-Eやその他の画像生成AIが、クリエイティブな仕事をする人にとって何を意味するのかが議論された。
このアート画像生成AIは、人が入力したテキストから、「ジェネレーションズ(generations)」と呼ばれるオリジナル画像を作成する。上の写真のように、「宇宙空間の海を泳ぐ宇宙飛行士の魚、デジタルアート」と入力し、そのアートスタイルを指定したり、ゴッホ風になど特定のアーティスト名を入力することも可能だ。
また、プログラムが毎月付与するクレジットを使用し、DALL-Eが生成した「ジェネレーションズ」を編集したり、自分の写真をアップロードして画像を作成することも可能だ。
DALL-Eが生成した「火星を走るF1カーのゴッホ風の絵」。
DALL·E/OpenAI
Whisper
Whisperは、音声をテキストへ変換する自動音声認識モデルで、多言語を識別して英語に翻訳することができる。このモデルは、複数の言語での文字起こしも可能だ。
OpenAIによると、このシステムはインターネットから収集した68万時間に及ぶ多言語およびマルチタスクの教師データ(機械学習に利用するデータのこと)で学習させたという。
製品ページに掲載されている例では、Whisperは約30秒の早口言葉の音声、K-POPの歌のクリップ、フランス語の音声、強いアクセントで話す人の音声をテキストに起こしている。
Codex
Codexは、自然言語を解析し、対応するコンピュータープログラム(コード)を生成するAIモデルだ。OpenAIによると、CodexはPythonで「最も有能」だが、JavaScriptやSwiftなど十数種類のプログラミング言語を熟知しているという。
Codexは、ユーザーから入力された簡単なコマンドを解釈できる。OpenAIによると、Codexは「汎用プログラミングモデル」であり、その成果はさまざまではあるが、「基本的にあらゆるプログラミング作業」に使用できるという。Codexはトランスパイル(あるプログラミング言語から他のプログラミング言語に変換すること)、コードの説明(複雑なプログラミングコードの一部を自然言語で説明すること)、コードのリファクタリング(プログラムの外部的動作を変えることなく内部構造としてのソースコードを変更すること)にうまく使えるとOpenAIは述べている。
OpenAIは、宇宙をテーマにしたゲームのプログラミングや、コンピューターに音声コマンドを与えてWord文書を編集する方法など、Codexの機能の例をいくつか紹介している。