「AIチャットくん」が生成した画像。右は「渋谷のメディア企業で働く記者」と入力して作成し、左は「記者」の部分を「男性記者」に変えた。
AIで作成
スーツ姿でメモを取る女性に、コーヒーを片手に持ったメガネの男性──。これはLINEに文字を打ち込むだけで、AIが生成したイラストだ。
実際に作ってみると驚くほど工程は簡単だった。「イラストモード」「人物モード」「風景モード」の3つのテイストの中から、「イラストモード」を選択し、日本語で「ネット経済メディアの記者」と入力。わずか1分後には、ぽっとLINE上にイラストが出現した。
「AIチャットくん」の操作画面。日本語を打ち込むだけですぐに画像が作れる。
撮影:横山耕太郎
LINEに作りたいイラストを文字で打ち込むと、すぐに画像が作れる「AIイラストくん」が話題を呼んでいる。
5月11日に公開されたばかりのサービスだが、すでにTwitter上では「AIイラストくん」で作った画像が多く投稿されている。
これまでもLINEでAIイラストを生成できるサービスはあったが、「AIイラストくん」は日本語で条件を入力すると、質の高いイラストを生成できるのが特徴だ。
現在、「AIイラストくん」は招待制となっており、招待されれば1日5回まで無料でイラスト作成ができる。
過去にも画像生成AIを使ったサービスはあったが、これまでのサービスとはどこが違うのか?
マイクロソフトのブースで展示会参加
「AIイラストくん」を開発したpiconの山口翔誠CEO。
撮影:横山耕太郎
2023年5月12日、東京ビックサイトで開かれた「AI・人工知能EXPO」の一角で、「AIイラストくん」を開発したpiconのブースには人だかりができていた。
piconはLINEで簡単にChatGPTが使える「AIチャットくん」を開発し、リリースから2カ月あまりで登録者が150万人を突破する大ヒットを記録。
piconはマイクロソフトのスタートアップ支援プログラムに採択されたこともあり、東京ビッグサイトではマイクロソフトのクラウドサービスの真横にブースを構えていた。
piconの山口翔誠CEO(27)は、リリースしたばかりの「AIイラストくん」について、次のように説明した。
「LINE上で日本語で作りたい画像について書くだけで、誰でも簡単に画像生成AIを使えるのが一番の魅力です。
これまでの画像生成AIは『言葉が画像になってすごい』と、開発者を中心に盛り上がっていた段階でした。でもやっと『こんなに簡単に、しかも自然な画像ができるのか』と広い世代に驚かれるサービスをリリースできたと思っています」
「AIチャットくん」がChatGPTを活用したのと同じように、「AIイラストくん」でも「画像生成AI」の本体は外部で開発されたサービスを使っている。
活用したのは、オープンソースで開発が進む画像生成AI「Stable Diffusion(ステーブルディフュージョン)」。Stable Diffusionは、ChatGPT登場の数カ月前にあたる2022年夏に世界的に話題になった。
最適な「指示」にChatGPTを活用
「AIイラストくん」が生成したイラストや人物。
出典:piconのウェブサイト
「AIイラストくん」は、外部の画像生成AIを“ただLINEで使えるようにした”わけではない。そこには、誰でも簡単にイメージどおりの絵が出るよう、独自の工夫をこらした。
Stable Diffusionを始めとする画像生成AIでは、AIにイメージ通りの絵を描かせるための指示(プロンプトと呼ぶ)に独特のノウハウがあり、これが使いこなすためのハードルの1つとも言える。
この課題を解決するため「AIイラストくん」では、日本語で入力された文字を、一度、ChatGPTに送信。ChatGPTが、日本語で書かれた文字を、より画像生成に適切な「指示」に変換する。
「『不気味の谷』とも呼ばれますが、『AIが作った画像』だと分からない高いクオリティの画像を生成するには、適切な指示を入れることも大事になります。そのためにChatGPTを活用することにしました」(山口氏)
慎重に「学習モデル」を選定
「AIイラストくん」では、3つのモードそれぞれに別の「学習モデル」を採用している。
出典:piconのウェブサイト
「AIイラストくん」が自然な画像を作り出せるもう一つの理由は、「学習モデル」の選定を徹底したからだという。
画像生成AIは、どのようなデータを学習するかで全く違う画像ができあがる。
人間のイラストを描く場合、性別や年齢や国籍など様々なパターンが考えられるが、例えば「日本人男性」を多く学習させたモデルを使えば、より自然な日本人男性のイラストを生成できる。
ただし、全世界で学習モデルが開発されており、学習モデルの数は「無数にある」という。
「AIイラストくん」では、「イラスト」「人物」「風景」の3つのモードから選んで画像を作るが、それぞれ違う学習モデルを使用している。
使用している学習モデルの詳細は公開していないが、モデルの開発者が、商用利用を禁止していないモデルを使用しているという。
画像生成AIに詳しいメンバーと山口氏が学習モデルを選定し、日本語で入力された文章を、それぞれの学習モデルにあった形で入力できるように調整している。
「AIが生成したグラビアアイドルが話題になりましたが、画像の質を大きく左右する学習モデルがここ数カ月で大きく進化し『AIイラストくん』の開発にも繋がりました。
質や安全性を考えた上で、1カ月以上かけて学習モデルを選定しましたが、『どのような指示を送れば、質の高い画像ができるのか』を考えるのはかなり大変でした」
開発メンバーが急増。全員20代
piconを2人で起業した渋谷幸人COO(右)と山口氏(左)。現在は業務委託も含めてメンバーは約15人に増えた。
撮影:横山耕太郎
piconは2人の会社だったが、新たにデザイナーを採用したほか、画像生成やクラウドの技術者、開発エンジニアなどが業務委託としてジョイン。
現在は約15人にメンバーが増えて急拡大中だが、メンバーの全員が20代という若さだ。
現在「AIイラストくん」は招待制で、「AIチャットくん」の有料会員(月額980円)からの招待や、公式ツイッターなどで利用希望者を招待している。
招待を受ければ1日5回まで無料で画像生成ができるが、有料会員(月額1280円)になれば、イラストの枚数制限なく使える。
生成された画像は利用規約に基けば「商用利用を禁止していない」ため、業務でイラストを使用することの多い企業のビジネス利用にも期待できるという。
ただし、利用規約によると「画像は画像生成AIを用いて生成されており、その性質上、確実性、完全性、真実性、正確性、合法性等が保証されていない」と明記している。
また「第三者との間で当該第三者の権利を侵害した又は侵害するおそれがあるとして紛争等が生じた場合には、ユーザー自身の責任と負担においてこれを解決するものとします」ともされており、画像を利用する場合については注意が必要だ。
また、著作権を侵害する可能性が排除できないことから、「既存の著作物、作家、作品及びキャラクターの名称(略称及び俗称等を含む)並びに実在する個人の名称を送信する行為」を禁止している。
生成AI「伝え方のうまさは僕たちが日本一」
山口CEOは「ChatGPTで物語を作ってそこにイラストを付けるなど、AIの合作も進めていきたい」と話す。
撮影:横山耕太郎
一方で、現在は無料でも使える『AIイラストくん』の運用には費用がかかる。
主な費用は、LINEの利用料に加え、サーバー費、クラウド利用料、ChatGPTの利用料に応じた使用料金(API利用料)で、有料会員からの収入や、資金調達で得た資金を充てている。
山口氏は「きちんとした価値を提供できていれば、有料会員も増やしていけると思っている」と見るが、「AIチャットくん」の大ヒットもあって、企業からChatGPTを利用したサービスの開発依頼なども増加。収益の多角化も進める方針だ。
「僕たちのミッションは生成AIをもっと広く使ってもらいたいということ。ChatGPTという名前は知っていても、まだ使ったことがない人はまだまだたくさんいます。
僕たちは生成AIをわかりやすく伝えるという面では、日本一うまいという自負があります。
今まさにChatGPT、イラストに続く新しいサービスの開発も、複数進めているところです。次の一手にも期待していてください」