Google CEOのサンダー・ピチャイ。
Stephen Lam/Reuters
グーグル(Google)は、機械学習を使ってコードを書き、修正し、アップデートするよう訓練する秘密のプロジェクトに取り組んでいる。
このプロジェクトは、画像、動画、コードなどを生成するためにアルゴリズムを使用する、いわゆるジェネレーティブAI(生成AI)の分野におけるグーグルの取り組みの一環だ。この取り組み如何では、グーグルの将来と開発者たちに大きな影響を与え得る。
この件に詳しい人物によれば、このプロジェクトはもともと「ピッチフォーク(Pitchfork)」というコードネームでアルファベット(Alphabet)の機密開発研究所「X」内で始まったが、2022年の夏にグーグルラボ(Google Labs)へと移管されたという。
グーグルに移ったということは、経営首脳陣の間で本プロジェクトの重要性が増していることを意味する。というのも、グーグルラボはVR/ARに関するプロジェクトを含む長期的な投資対象に取り組んでいる部門だからだ。
ピッチフォークは現在、Google Glass(グーグルグラス)などのムーンショット・プロジェクトに長らく携わってきたXの社員であるオリビア・ハタルスキー率いるラボ「AI開発者支援(the AI Developer Assistance)」の研究対象となっている。ハタルスキーは、ピッチフォークがグーグルに移転したのに伴い、同ラボに移籍した。
Insiderが確認した内部資料によると、ピッチフォークは「コードの書き方や書き換え方を教える」ために作られた。このツールは、プログラミングスタイルを学習し、その学習に基づいて新しいコードを書くように設計されていることが、本件に詳しい人物の証言やInsiderが確認した特許から確認できた。あるグーグルの担当者は次のように話す。
「同チームは、リサーチチームと密接に連携しています。彼らは、開発者を支援するためのさまざまなユースケースを探索するために協業しているんです」
ピッチフォークの当初の目標は、グーグルの開発言語であるPythonで書かれたコードを新しいバージョンに更新できるツールをつくることだったと、グーグルの担当者は明かす。このプロジェクトの初期を知る人物は、「要するに『あるバージョンから次のバージョンへの移行を、新しく人を雇わずに行うにはどうすればいいか』という発想」だった、と話す。
だが、やがてプロジェクトの目標は、コードの質を維持しつつ、人間がコードを書いたり更新したりしなくてもいい汎用的なシステムをつくることへと変化していった。2021年末からしばらく掲出されていたXの求人情報には、ハタルスキーは「ソフトウェアエンジニアリングの未来を構築する」チームで働いている、と書いている。
ジェネレーティブAIのブーム
グーグルをはじめとするテック企業は、ジェネレーティブAIですでに大きな前進を遂げている。
マイクロソフト傘下のギットハブ(GitHub)は、開発者が入力するコードや機能のスニペットを提案する「コパイロット(Copilot)」というツールを発表した。開発者はコパイロットを使ってコードの最大40%を生成しており、この数は今後5年以内に倍増するとギットハブは予想しているとブルームバーグは報じている。
グーグルは他にもいくつかのAIコードプロジェクトに取り組んでいる。同じアルファベット傘下のディープマインド(DeepMind)は、AIを使ってコードを生成するアルファコード(AlphaCode)というシステムを持っているが、現在はコンペティティブ・コーディング、つまり競争力のあるレベルでプログラムを書くことに注力している。
また、グーグルはギットハブのコパイロットに似た、開発者が入力したコードスニペットの候補を機械学習で生成するツールも開発中だ。グーグルのシニアリサーチディレクターであるダグラス・エックは、11月初旬にニューヨークで開催されたイベントで、このツールを使用したグーグル社員の間でコーディングのイテレーション時間が6%改善されたと述べている。
グーグルのAI開発者支援プログラムはさらに一歩進め、システムを訓練することでより多くの作業を自ら行えるよう取り組み中だ。このプロジェクトはまだ初期段階であり、これらのモデルの訓練の仕方をめぐっては、グーグルはバイアスや潜在的な著作権の問題など、悩ましい倫理的配慮も検討しなければならない。
11月初めには、コパイロットツールがAIを使ってオープンソースのコードを複製することで「前例のない規模のソフトウェア・プライバシー」を犯したとして、ギットハブに対して集団訴訟が起こされたとThe Vergeは報じている。