NTTは自社開発の「国産LLM」を発表。2024年3月の商用開始を目指す。
撮影:小林優多郎
NTTは11月1日、チャット型生成AIなどで使われる自社製の大規模言語モデル(以下、LLM)「tsuzumi」を発表した。
tsuzumi(つづみ)は日本語と英語、図表読み込みに対応したLLMで2020年にNTTがリリースした「NTT版BERT」が前身としている。2023年10月には社内外のトライアルを開始し、2024年4月には商用利用を開始する方針だ。
今、同種のAIサービスでは、OpenAIの「GPT」やメタ(旧フェイスブック)の「Llama」、グーグルの「PaLM」といったアメリカ勢が注目を浴びている。
そうした中で、より日本語に特化し、国家安全保障上でも必要性がある「国産LLM」を期待する声も同時に高まっている。
すでに国産LLMとしては、産業技術総合研究所や東京大学松尾研究室、ソフトバンクなど、研究機関や企業なども開発されている。NTTの開発するtsuzumiはどのような特徴を持っているのか解説する。
最軽量モデルは「スマホでも動く」ことも想定したコスパLLM
tsuzumiの持つ特徴。なお、tsuzumiはその名の通り、楽器の「鼓」から名付けられている。
撮影:小林優多郎
同日に開催した説明会で、NTT島田明社長はtuzumiの特徴は主に4つあると説明している。
- 日本語と英語に対応。特に日本語の回答性能は世界トップクラス
- GPUのコストはGPT-3規模のLLM比で、学習時は約25分の1、利用時は約20分の1
- 業界や企業内リソース、用途に特化させられる高い柔軟性
- 文章だけではなく、図表、請求書などのドキュメントの読解にも対応
NTTが特に強調しているのは「コストパフォーマンス」だ。
tsuzumiは現時点では、超小型版の「tsuzumi-0.6B」、小型版の「tsuzumi-7B」の2種類が存在する。それぞれの数値はパラメータサイズを表しており、これはOpenAIの「GPT-3」(175B)と比較すると、超軽量版は約300分の1、軽量版は2分の1をサイズ感になる。
tsuzumiは現在2種類のサイズが用意されており、13B以上を想定した「中型版」も想定されている。
撮影:小林優多郎
パラメータサイズが小さいことのメリットは学習コストと推論コストのそれぞれが抑えられる点にある。
特徴的なところだと、超小型版の「tsuzumi-0.6B」について、NTTはCPUでも実行可能としている。こうした生成AIの実行には一般的に、高速な並列処理を行えるGPUが必要なため、これはかなり手軽に実行できることを意味している。
NTT執行役員 研究企画部門⻑を務める木下真吾氏。
撮影:小林優多郎
NTTの執行役員で研究企画部門⻑を務める木下真吾氏は「(スマートフォン上での実行も今後の開発)ターゲットに入っている」とし、その軽量さをアピールしている。
そして、コストを低くしつつ性能をも担保するとNTTは話す。
1日の説明会では実際のQ&A式のチャットや図表を読み込みその内容についての質問に答えるデモが披露された。基本的にNTT側の用意した質問や図表を使ってはいたが、動作スピードや回答精度に遜色は見られなかった。
tsuzumiが文章や画像から回答している様子。
撮影:小林優多郎
もう少し体系的な数値は、NTTが公表した「Rakudaベンチマーク」(日本語に特化したYuzuAIのベンチマーク)の結果を見てみよう。
Rakudaベンチマークの結果比較。
出典:NTT
小型版のtsuzumi-7Bでの結果になるが、OpenAIの「GPT-3.5」、エライザの「Elyza 7B」、Stability AIの「Ja Stable 7B」、東大松尾研の「Weblab 10B」などのいずれにも上回る性能が出ている。
ただし、例えばStability AIはNTT発表の翌日の11月2日に新しい日本語LLMを発表するなど日進月歩の状況が続いている。
また、ベンチ結果が公表されていないOpenAIの最新LLM「GPT-4」については、木下氏が「(性能を上回るのは)なかなか難しい。(今は)GPT-3.5と互角で、これからGPT-4に向かっていく」と述べるにとどまっている。
NTTはこうしたLLMのコストパフォーマンス実現にあたっては「クオリティーの良いデータを与えることで頭を良くしている」(木下氏)と述べ、学習データを厳選し、1980年から続いているNTTの自然言語処理のノウハウを活かしているとしている。
ソリューション展開で年間1000億円の売り上げ目指す
10月からトライアルを開始し、2024年3月から商用開始、4月以降に高機能化を目指す。
撮影:小林優多郎
では、NTTは自社開発のLLMを使ってどのようなビジネスを考えているのか。
説明会場では「プラットフォーム型」と「インテグレーション型」の2つのビジネスモデルについて言及があった。
プラットフォーム型とは、OpenAIの「ChatGPT」やそのAPIのように、さまざまな人や企業が自由に開発しその利用料で稼ぐ仕組み。インテグレーション型は特定のサービスや用途にカスタマイズして提供して、その利用料や開発費用で稼ぐ仕組みだ。
NTTの島田明社長。
撮影:小林優多郎
木下氏は「両方を探っていきたい」としたが、島田社長は「今まで提供してきたサービスにtuzumiを加えてパワーアップさせることからスタートするのが、ビジネスの展開としては早いと思う」と、後者のインテグレーション型のビジネスモデルをまずはとっていくことを示した。
すでに開始しているtuzumiのテスト事例としては、京都大学医学部附属病院と新医療リアルワールドデータ研究機構(PRiME-R)との「カルテの構造データ化」や、東京海洋日動との「コンタクトセンターでのコールワークの負担削減」などが公表された。
京都大学医学部附属病院と新医療リアルワールドデータ研究機構(PRiME-R)とのテスト事例。
撮影:小林優多郎
東京海洋日動とのテスト事例。
撮影:小林優多郎
また、島田氏のいう既存のサービスでは、NTTデータが提供する提案書や見積書を検索する「knowler」やチャット「eva」、文書読解の「LITRON」といったAIソリューションにtsuzumiの技術を展開していく。
島田社長は今後の国産LLM市場がどのように拡大していくかは「まだわからない」としてどの程度の市場規模を目指していくかは明らかにしなかった。ただし、5月12日に公表した新中期経営戦略に沿う形で「(2027年度までに)tuzumiの付加価値で年間1000億円」の売上を目標にしていると明らかにした。