OpenAIの共同創業者でCEOのサム・アルトマン。
Drew Angerer/Getty Images
- 「ChatGPT Plus」の加入者が利用できる「GPT-4」が、ついに発表された。
- OpenAIが開発し、大きな話題となっているChatGPTは、これまで言語モデルとして「GPT-3.5」を搭載していた。
- GPT-4がGPT-3.5と異なる点を5つ紹介する。
OpenAIは2023年3月14日、大規模自然言語モデル「GPT-4」をついに公開した。
大人気の「ChatGPT」に搭載されている「GPT-3.5」のアップデートで、従来よりも信頼性が高く、クリエイティブだとOpenAIは評価している。サム・アルトマン(Sam Altman)CEOによるとGPT-4はアメリカの司法試験に合格するレベルで、「AP(アメリカの大学入試試験)のいくつかの科目で高得点を取ることができる」という。
GPT-4の利用は「ChatGPT Plus」という有料版を契約しているユーザーが対象となる。また、APIへのアクセスはOpenAIのウェイティングリストに載っていた限られた開発者にのみ許可される。
しかし、マイクロソフト(Microsoft)の検索エンジンBingを試した人は、すでにGPT-4の一部を体験していることになる。マイクロソフトは3月14日、AIを強化したBingが搭載していたのは「検索用にカスタマイズされた『GPT-4』」だったと発表したのだ。
GPT-4がGPT-3.5と異なる5つのポイントを紹介する。
1. 画像を理解
GPT-4は、テキストだけでなく、画像のプロンプトも処理できる「マルチモーダル」となっている。これを搭載したチャットボットは、画像について説明できるだけでなく、その画像の文脈を捉え、理解することまでできる。OpenAIが示した一例では、チャットボットが一連の画像のどこが面白いかを説明する様子が示されている。
ただし、まだテキストでしか応じられず、画像そのものを生成することはできない。
2. 高い精度
OpenAIによると、今回のアップデートにより、ユーザーのクエリに対してより正確な回答ができるようになったという。
OpenAIは「GPT-3.5と比較して、事実に基づいた回答を出す可能性が40%高くなった」とブログに記している。また、GPT-4はGPT-3.5よりも「高度な推論能力」を備えているという。
GPT-4は「幻覚」と呼ばれる誤った回答や推論エラーを生成する傾向に対してまだ対処できていない。OpenAIは、このモデルは完璧ではないと述べており、アルトマンも「まだ欠陥があり、限界もある」とツイートしている。
3. 会話はより長く
GPT-4は、GPT-3.5の約8倍の長さのテキストを読み込んだり生成したりできる。
これは、「記憶」の容量が大きくなり、より長い会話に対応できるということを意味する。OpenAIによると、従来の3000語に対し、最新版は最大2万5000語を処理できるようになったという。
4. ルールを破ることが困難に
GPT-4の登場は、ChatGPTの「邪悪な分身」のファンにとっては悪いニュースかもしれない。
多くのユーザーがChatGPTの規制を潜り抜け、不適切な回答をさせようと試みており、悪意のあるさまざまなテキスト(プロンプト)を入力しているようだ。
だがOpenAIは、今回のアップデートで「操縦性」や「規制から外れることに対する拒絶」に関して、過去最高の結果が出たと述べ、「禁じられたコンテンツに対するリクエストに応じる可能性が82%低くなった」としている。
5. よりクリエイティブに
OpenAIによると、今回のアップデートはこれまでで最も創造的で共同作業に適したバージョンだと述べている。
カジュアルな会話では「わずかな」な変化であっても、複雑な状況に直面したときには、その変化が明確になるという。また、GPT-4は「指示の微妙なニュアンスを理解して対応する力が、GPT-3.5よりもはるかに高い」としている。
ユーザーとの共同作業により、チャットボットは脚本のようなクリエイティブな文章を生成し、編集することができる。さらに、ユーザーのライティングスタイルを学習することもできるという。