グーグルが外販するAI向け半導体「Edge TPU」の全貌:Google Cloud Next ‘18

104

2日目の基調講演で「Edge TPU」を公式に世界初披露する、Google CloudのIoT担当のバイスプレジデント、Injong Rhee氏。

グーグルのクラウド部門(Google Cloud)が開催しているテクノロジーコンベンション「Google Cloud Next'18」は、現地時間7月25日午前(日本時間7月26日未明)に2日目の基調講演が行なわれた。

この中でグーグルはこれまで同社のクラウドサービスのみに活用してきた、深層学習向けの半導体「TPU」(Tensor Processing Unit)を、IoT(Internet of Things)などの端末側、つまりエッジ側デバイス向けに利用する「Edge TPU」(エッジティーピーユー)を初披露。顧客となるデバイスメーカーに提供していくことを明らかにした。

グーグルによると、Edge TPUは2W/4TOPSの性能を備えている。オランダの半導体企業、NXP社のクアッドコアArm CPUを内蔵したSoCなどと、「SOM」(System On Module)と呼ばれるモジュールに実装されて提供される。このEdge TPUでグーグルは何を狙い、どのようなことを実現していくつもりなのか、現地で取材して分かったことを元に考察していきたい。

グーグルが発表したAIの“推論専用”プロセッサ「Edge TPU」の全貌

Edge TPU

グーグルが発表したEdge TPUが搭載されたSOM(System On Module)とベースボードの実物。

グーグルが7月25日に、Next'18で行なった2日目の基調講演では、同社が新しい半導体製品としてAIの“推論”(※)を端末側で行うための「Edge TPU」を発表した。

グーグルは近年、自社設計半導体に力を入れており、2016年の5月に第1世代のクラウド向けTPU(Tensor Processing Unit)を発表している。第1世代のTPUは、「Google Cloud Platform」(GCP)向けのプロセッサとして開発された。GCPでのマシンラーニング(機械学習)/ディープラーニング(深層学習)の推論に特化している。

推論とは:マシンラーニング/ディープラーニングには学習と推論という2つのパートがある。「学習」はAIの知能を育てる処理のこと、「推論」はそのAIを利用して、たとえばカメラに映った物体がネコか犬か判断する、といったことに利用する

その1年後の2017年5月には第2世代のTPUが投入され、推論に加えて学習も行なえるようになった。そして2018年5月に行なわれたグーグルのモバイル開発者向けの年次イベント「Google I/O」では、第3世代TPUの概要が発表され、今回のNext'18では第3世代TPUを利用したアルファテストが開始されたことが明らかにされている。

今回の「Edge TPU」の登場は、一連のグーグルの動きをさらに加速させるものだ。

Edge TPUのサイズ

1セントコインよりも小さなパッケージに入っているTPU。

これらグーグルのTPUは、これまではクラウドサービス(つまりはGCP)向けの、巨大なデータセンターの中に置いて利用するプロセッサとして活用されてきた。

グーグルが設計して、ファウンダリー(受託生産を請け負う半導体製造業者、TSMC社やGLOBAL FOUNDRIES社などが有名)に外注して製造してもらう。ポイントは、自社で消費する分だけの製造だったことだ。

しかし、今回グーグルが発表したEdge TPUは、グーグルが設計してファウンダリーで製造されるTPUとして、初めて顧客(デバイスメーカー)に外販される製品だ。そして、使われる用途もGCPのようなクラウド側でなく、エッジ側、つまりIoT側(端末側)への搭載ということになる。

これまでのクラウド向けTPUとのアーキテクチャ的な違いについて、グーグルは何も説明していない。アメリカの1セントコインよりも小さなパッケージに封入できるような、小さなチップサイズになっているため、低い消費電力で高い処理能力を実現しているのが特徴だ。

なお、製造プロセスルール(半導体回路の微細化のレベル)や、どこのファウンダリーで製造されているのかなどに関しては非公表だ。

003

SOMとベースボード。Edge TPUの他、クアッドコアのArm CPUとGPUを内蔵している。NXPのArm SoC、Wi-Fiコントローラ、Microchip社のセキュアエレメントが搭載されている。

なぜグーグルもインテルなど半導体の巨人が「推論専用」チップに取り組むのか

103

Edge TPUによる、カメラ映像の推論処理のデモ。他社の先行事例同様に、こうした動画を解析する画像認識が、カメラなどのIoT製品単体である程度処理できるようになる。

こうしたIoTに向けて、エッジデバイスでの推論に特化した半導体製品を発表したのは、実はグーグルが最初ではない。半導体業界のジャイアントであるインテルも、同社がMovidius(モヴィディアス)社を買収して得た、「Movidius Myraid」シリーズを既に出荷開始している。

Movidius MyraidをIntelではVPU(Vision Processing Unit)と呼んでおり、エッジデバイスでの画像認識に強いプロセッサとされる。グーグルのEdge TPUと同様、低消費電力での推論に特化しており、1Wという低い消費電力で動作することが特徴だ。

さらに、NVIDIAも自動運転向け、Edge AI向けと同社が位置づけている「Xavier」(エグゼビア)において、特定の推論処理を低消費電力で行うDLA(Deep Learning Accelerator)と呼ばれる演算ユニットを搭載している。

101

なぜ各社が同じ動きをするのか? それは、エッジ側の性能が今後、自動運転や画像処理を伴うIoT製品の発展の中で重要になってくるからだ。

IoTが扱うデータが膨大になると、ある程度はエッジ側で処理することが求められる。サーバーに送るための回線やサーバー側のストレージがパンクすることが容易に想像できるからだ。何よりも自動運転のように瞬時に判断が求められる処理には、「データを送ってクラウド側の処理を待つ」ようなまどろっこしいことはできない。

そこで、エッジ側にマシンラーニング/ディープラーニングの推論機能を持たせ、ある程度の処理をさせるという考え方が広がっている。これが、最近業界で耳にすることが増えてきた「エッジAI」だ。

クラウドからエッジ側の半導体まで手がけるのが「自明」な理由

Edge TPUについて、グーグルは決して「GCP専用」とは言わないが、利用するにはグーグルのCloud IoT Coreと呼ばれるサービスと連携することが前提。事実上のGCP専用と言っていいだろう。

004

Edge TPUが搭載されているSOMとベースボードの表。

005

ベースボードの裏側。

グーグルが一気通貫でクラウドサービスからエッジ側半導体まで提供することができれば、ハッキングに対してセキュリティ性を高められる。そして、IoTの時代にはこの、「一気通貫の仕組みによるセキュリティ性」が極めて重要になる。

なぜなら、IoTに参入しようとするメーカーのすべてが、ハッキング対策に十分なノウハウを持っているとは限らないからだ。(例えば)グーグルが提供するクラウドサービス、それと連携する半導体を選ぶことで「セキュアなIoT」と「付随するサービス」をスマートに構築できるなら、選ぶ側(メーカーや消費者)にとって大きな魅力になる。

一方で、グーグルなどのクラウドサービス事業者にとっては、一気通貫で提供することでユーザーの「囲い込み」ができるメリットもある。

現在はまだクラウドサービスの市場自体が成長しているが、どこかで成長が止まったときにモノを言うにはシェアの広さだ。各社のシェア争いの熱量は、首位のAmazonよりも業界2位のマイクロソフト、3位のグーグルの方が(当然ながら)より強いだろう。

グーグルのEdge TPUの投入も、そうした文脈の中で捉えておくと理解しやすい。

(文、写真・笠原一輝)


笠原 一輝:フリーランスのテクニカルライター。CPU、GPU、SoCなどのコンピューティング系の半導体を取材して世界各地を回っている。PCやスマートフォン、ADAS/自動運転などの半導体を利用したアプリケーションもプラットフォームの観点から見る。

ソーシャルメディアでも最新のビジネス情報をいち早く配信中