暗号資産プロジェクトは、ブロックチェーンを使用してAIモデルの開発に貢献している。
http://www.fotogestoeber.de/Getty Images
分散型ブロックチェーンプラットフォームと暗号資産(仮想通貨)は金融業界の障壁を取り払うだけでなく、人工知能(AI)の開発に革命を起こすことを目指している。
OpenAIのChatGPTのようなアプリケーションは、その刺激的かつ恐ろしい能力に注目が集まっている。しかし多くの人々が理解していないのが、これらのモデルの裏にある仕組みとそれを構築するために必要となるものだ。
例えば、機械学習モデルを訓練しようと思うと月に5000万ドル(約66億円、1ドル=132円換算)もの費用がかかる。仮想通貨分析企業、メッサリ(Messari)のリサーチアナリストであるサミ・カサブ(Sami Kassab)氏による最新のレポートによると、これはオープンソースのジェネレーティブAIを開発するStability.AIが、自社のモデルを訓練するためにAWS(アマゾン・ウェブ・サービス)のクラウド上で稼働する4000台のNvidiaのGPUを使用するために支払っている金額だ。
「一見順調に進んでいるように見えるAI開発ですが、根本的な課題やボトルネックに対処する必要があります。実際、ビジネスや消費者がAIを受け入れるにつれて、コンピューティングパワーを巡るボトルネックが顕在化しています」
カサブ氏はレポートの中でこう述べている。
これらのAIシステムが必要とするコンピューターパワーの需要は数カ月ごとに倍増しており、供給が追いついていないという。大規模モデルの学習コストは過去10年間、毎年約3100%ずつ増大し続けているのだ。
そうなると、小規模な企業やスタートアップはAI開発レースから弾き出されてしまう。レポートによると、自社のモデルを非公開にした巨大なテック企業がAIの開発を独占し、その過程で競争、コラボレーション、透明性、学界からのインプットなどを抑圧する可能性があることも意味するという。
「これらのテック企業の閉ざされたドアの向こうには数多くのモデルが存在します。学術界が問題としているのは、そのアウトプットをまったく検証することができないということです」とカサブ氏はインタビューの中でInsiderに語った。
「そのため、人々はこれらのモデルによるアウトプットが基本的に正しいと信頼することになります。そのような世界では、大手のテック企業が提供するモデルが正確で、私たちの知らないところで操作したりしていないだろうと信じることになります」
かつて民間の防衛航空産業の機械技師だったカサブ氏は、物理的なハードウェアデバイスを利用する暗号資産プロジェクト、あるいは分散型物理インフラネットワークとも呼ばれるものに興味を持つようになった。現在の彼の研究は、仮想通貨とAIが交わる点に位置している。
彼の最近のレポートは分散型機械学習計算ネットワークを開発している暗号資産プロジェクトに注目している。これは、ブロックチェーンによって世界中のハードウェアを活用して、分散型のクラウドのようなネットワークを構築するものだ。
基本的には、GPUやCPUのようなハードウェアを持っている人ならば誰でも、AIモデル開発をサポートするために自身のコンピューティングパワーを提供することができる。引き換えに、提供者はそのブロックチェーンに関連する仮想通貨で報酬を受け取る。ブロックチェーンは利用者がコンピューティングパワーの提供者を見つけてやり取りすることを促進するマーケットプレイスのように働くのだ。
もし世界中からコンピューティングパワーを提供してくれる個人を十分に集めることができれば、企業は自社のモデルを訓練するためにAWSのような巨大企業に頼らずにすむかもしれないとカサブ氏は語る。計算はオフチェーンだが、ブロックチェーンがトランザクションを調整する。例えば、映画やテレビ向けの映像をレンダリングする企業が閑散期に受動的な収入を得るために自社のリソースを提供するということも考えられると彼は指摘した。
AWSはあまりに巨大なので、真正面からそれと競争することは不可能だ。しかし同様のネットワークを構築するためのリソースをクラウドソーシングで調達し、それによって支出を減らしてAI開発への参入障壁を低くすることができるという。
「この方法ならAWSなどのクラウドプロバイダーを利用するよりも、最大で90%安くすむ可能性があります」とカサブ氏は述べている。
「分散型計算ネットワークがこれほど費用対効果の高いソリューションである主な理由は、本質的にはお金を稼いでいないリソースを活用して、所有者に支払いを行っているからなのです」
暗号資産プロジェクトがAIへの障壁を下げる
レポートによると、AIの開発には主に5つの段階があり、その各段階において開発をサポートする能力がある、またはその能力を構築中の暗号資産プロジェクトが存在する。
これらのブロックチェーンを用いたユースケースが増加するにつれて、そのブロックチェーンのトークンに対する需要もまた増えるだろうとカサブ氏は指摘した。誰かがあるブロックチェーンのマーケットプレイスを使ってモデルを訓練したい場合、トランザクションを行うためにはそのトークンを所有する(購入する)ことが求められるからだ。それがトークン価格を押し上げる。そして、より多くのモデルが構築されれば、トークンの価値は上昇の一途をたどることになる。
AI開発の最初の段階は分散型ストレージで、これはAIモデルが訓練を行うデータを単に保存するものだ。レポートによると、filecoin、arweave、sia、storj等の暗号資産はこれをサポートすることができる。
次に、データの前処理だ。これはモデルの訓練に向けた準備として生のデータを利用しやすいフォーマットに整理する段階だ。filecoinはこの段階をサポートすることが可能で、akashはCPUの能力は持っているがGPUの能力は開発中だ。
そして、モデルの訓練だ。この段階では、初期のAIプログラムはデータを処理し、いくつかのパターンとそれらの間の関係性を学習する。これには訓練プロセスを検証することができる、より特定用途向けのネットワークが必要となる。現状この能力を持つ暗号資産プロジェクトはgensynとtogetherの2つだが、これらのブロックチェーンはまだ稼働していない。
次の段階では、モデルが特定のタスクを完了できるようにモデルを微調整する。例えば、モデルが入力された文章を元に画像を生成したり、財務予測を出力することができるようになる。
最後はモデルを配置することで、これはモデルの使用準備が整い、その目的のタスクを実行することができる段階だ。言い換えると、この段階でモデルにインプットを与えるとアウトプットを返してくる。
最後の2つの段階はともにモデルの訓練ほど大変なものではないので、より多くの暗号資産プロジェクトがサポートすることができるだろう。それらのプロジェクトにはcudos、iExecが含まれ、さらにakash、exaBITS、flux、golem等のプロジェクトがこのニーズにさらに応えるためにその能力を拡大中だ。
「私たちは遂に暗号資産の本当のユースケースが現れるのを目にし始めています」カサブ氏は言う。
「以前なら、あなたは『分かった。それで実際のエンドユーザーのユースケースはどんなものなんだい?』と尋ねていたでしょう。そこで具体的なユースケースを答えることは難しかったのです」