無料のメールマガジンに登録

平日17時にBusiness Insider Japanのメルマガをお届け。利用規約を確認


無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】

Memeplex

筆者が開発した作画AIサービスと、生成した画像。作画AIサービス公開から間もなく3週間。9月12日時点で、ユーザーが生成した画像は40万枚を超えている。

作成:伊藤有

無料の作画AIモデル「Stable Diffusion」(ステーブル・ディフュージョン)が8月23日に公開されてから、1週間分の記憶はほぼない。次に気がついたのは、1週間後の8月30日の午前3時だった。

プログラミングに集中するといつもこうなる。その後まで含めて十数日間、ほとんどベッドで寝た記憶がない。

振り返れば8月23日、たまたま夜中に目が覚めてしまったのがまずかった。その直後にStable Diffusionが全世界に向けて公開され、どれほどの実力なのか確かめてやろうと、試しにプログラミング言語Pythonのコンソール(端末)を起動してしまった。

2時間後、朝日が昇る頃には、「日本語で言葉を入力すると、自動的に英語に翻訳して投入する」無名のWebサービスを立ち上げていた。

そこから怒濤(どとう)の日々が始まった。

「Stable Diffusion」にハマって身の上に起こったこと

stablediffusion_memeplex-6

実際にStable Diffusionで作画した絵。宮崎駿風を指定したのでアニメ絵だが、もっと実写風の画像も生成できる。AIに作画させる指示文(プロンプト)は「Gun Ship from Nausicaä of the Valley of the Wind by Hayao Miyazaki」。

作成:伊藤有

もともと、筆者は「Gakyo」(がきょう)という同様のAI作画サービスを1年前から運営していた。

当時はまだ「AIに絵が描ける」と言っても抽象的なものが主流だった。素晴らしい成果が得られることもあるが、ナンセンスな結果も少なくなかった。取れ高がどうなるかまったく読めない、いわゆる「AIガチャ」だ。生成にかかる時間は1枚あたり数分から数十分。

Stable Diffusionの登場は、筆者の常識を一変させた。

1枚あたりの作画時間はわずか数秒になり、「生成された絵の再構成」もできるなど自由度が高く、抽象的というよりはかなり具体的な絵が描けるようになった。

Stable Diffusionに先だって、ここ数週間、同様の機能を持つMidjourney(ミッドジャーニー)が話題になったことは記憶に新しい。筆者もその威力を紹介してきた。

しかしMidjourneyはあくまでも営利企業による有料サービスだ。

無料で試せるのは25枚程度でしかなく、月額30ドルを支払ったとしても200枚までしか描けない。実際にハマると分かるが、200枚描いたくらいでは到底、Midjourneyの全容を把握することはできない。

Stable Diffusionは、Midjouenryとまったく同じではないにしても、枚数制限なく好きなだけ、自分の手元で作画AIを使える。ここに圧倒的な可能性を感じたわけだ。

AIを操る「呪文」を探索する旅のはじまり

stablediffusion_memeplex-5

Stable Diffusionで作成した、SF映画をイメージした画像。

作成:伊藤有

AIをうまく操るための「指示文(プロンプト)」は、通称「呪文」と呼ばれている。世界中の作画AIファンが「いい呪文」を探そうと躍起になっている。

Stable Diffusionは、AIモデルが無料で公開されただけでなく、商用利用も可能という大胆なものだ。これによって世界中の作画AIファンのプログラマーたちが、思い思いの実装を開始した。

Photoshopのようなグラフィックスソフト向けのプラグインや、メッセージングアプリのLINEから呼び出せるものなど色々なものが作られ、あっという間にリリースされ、ビジネスの萌芽になっていった。

Stable DiffusionをPhotoshopのプラグインとして動作させる実演デモ。オープンソースの有望な技術は、腕に自信のあるプログラマーの手にかかれば、あっという間に新しい応用が具現化される。猛烈にネットワーク効果が働くのだ。

出典:Christian Cantrell

筆者が2時間でコードを書いた無名のWebサービスも当然、その流れのなかにあるものだった。とはいえ、同種のサイトを1年間にわたって運営してきた経験から言えば、「絵を描かせたい」という欲求はかなり限定的であり、万人が使いたがるものとは言えない……と考えていた。

これが、大間違いだったのだ。

サービス開始初日でサーバー料金が万円単位に

大間違いだと思い知ったのは、サービス開始の翌日、グーグルのクラウドサービス「Firebase」の請求書を見た時だった。その日、メールで届いた請求書の金額は、1日で利用料金が1万円を突破していた。その後も請求金額はさらに増加傾向を示していた。

これは十分な異変だ。

そもそもStable Diffusionを使う前は、毎月数百円から、多くて数千円が請求されるだけのサイトで、筆者の日々の小遣いの範囲でどうとでもなる金額だった。しかし、初日で1万円を超えるというのは尋常じゃない。

今時のWebサービスは、設計を間違うといとも簡単に大金を請求されてしまう。2時間のやっつけで作ったサービスだったため、設計がいろいろとまずかった。

結果、とにかく大量のアクセスをお金で捌く、みたいな構造になっていた。このままだと1日10万円、月額300万円くらいの請求にもなりかねない。

stablediffusion_memeplex-4

実際の請求画面。公開から2日程度で10万円近い請求額になっている。

筆者キャプチャー

早急になんとかしなければならない。

そこで緊急開発でまずサイトを無料会員制に移行した。合わせて、名称を「Memeplex.app(ミームプレックス)」に変えた。

Memeplexとは、文化的遺伝子であるミーム(meme)によって構成された、ミーム複合体を意味する。「さまざまな人間の営みを学習したAI」と、「AIを使いこなすための呪文(プロンプト)を研究する人間たち」の想いの応酬が行われるAIサービスにはまさにふさわしい名前と思えた。

会員制といっても、Googleアカウントさえもっていれば誰でもシングルサインオンできるような設計だ。

これで作画リクエストのキュー(作画の処理待ち)を一人一人が個別に持つようにして、数日かけてサーバー負荷を減らしていった。

サーバー代の問題は出口が見えた。が、コストとの戦いはこの程度では終わらない。

自宅の作画GPUマシンではもう無理だ……

次に困ったのが作画を担当する高性能なGPUマシン(PC)の不足だ。

当初は自宅にあった開発用のGPUマシン数台でMemeplexの作画をやりくりしていたが、ユーザーが増え、サービスそのものが大きくなったことで、殺到するリクエストをさばききれなくなってきた。

それならパソコンを買い足せばいいのでは?と思う人もいるかもしれない。ところがAIの作画というのは、そんじょそこらのパソコンでは満足に動かせない。

グラフィックボード(GPU)だけで13万円から30万円、ものによっては100万円を超える。

急場を凌ぐために、筆者が働くコワーキングスペースの「技研ベース」に、新しいGPUマシンを追加購入することにした。が、かなりキツキツに見積もってもマシンは1台35万円になった。しかも今後、これを何台も買い足す必要がある。

stablediffusion_memeplex-1

筆者が働くコワーキングスペース、技研ベースで作画マシンを組み立てている様子。Memeplexで動作させるための悪戦苦闘する様子は筆者のYouTubeチャンネルshi3z showでも公開している。

撮影:清水亮

それだけでは終わらない。膨大な電気代を覚悟しなければならない。

いくらになるのか見当もつかないが、24時間、空調で冷やし続ける必要があることを考えると、電気代が月に十万円を突破しそうなことは想像に難くない。

正直、途方に暮れていた。

そんなときに助け舟をだしてくれたのが、さくらインターネットの田中邦裕社長だ。

「お困りでしょう。すぐにGPUサーバーを用意します」

そう言って、あっという間にさくらインターネットが所有する北海道・石狩のデータセンターにあるGPUサーバーを「とりあえず9台」無償で貸していただけることになった。

さくらインターネットが提供する「高火力コンピューティング」というサービスは、おそらく世界で最も安価に占有GPUサーバーを使う方法の1つだ。

なぜ9台なのかというと、さくらインターネットの申し込みフォームで一度に申し込める限界が9台だったからだ。

注:料金プランにはさまざまな形態があるが、筆者が支援を受けたのは「さくらの専用サーバ 高火力シリーズ」というもの。月額課金と時間課金利用の2種類がある。

実は、さくらインターネットがこうした個人のWebサービス運営者を支援する試みは、これまで何度もあった。たとえば2017年、オープンソース版Twitterともいうべき「マストドン」というサービスが瞬間的に大流行したことがあった。

その際に、国内最大級のインスタンス(サーバー)だったmstdn.jpのサーバーを無償で支援していたのもさくらインターネットだった。常に個人のWebサービス開発者にとって「困ったときの強い味方」であり続けている。

筆者はこの春に会社を辞めて、個人として活動し始めた矢先だったので、さくらインターネット田中社長のご厚意に非常に感謝している。

さくらインターネットの高火力サーバーが稼働し始めると、まるで魔法のようにキューが減っていった。

例えば「90人待ち」と出ていたら、以前は「作画が完了するのは1時間後くらいかな」と考えていたのだが、さくらの高火力サーバーを使うと数秒で1枚の作画を完了できる。並列処理で9つの画像を同時に作図しているからだ。

今度は人間の想像力のほうが追いつかなくなる番だ。

  • Twitter
  • Facebook
  • LINE
  • LinkedIn
  • クリップボードにコピー
  • ×
  • …

あわせて読みたい

Popular