180分待ち! AIロボットカー競技「DeepRacerリーグ」日本初開催、これは面白い【AWS Summit Tokyo 2019】

deepracer-29

国内初開催とあって参加者が殺到。AIロボットカー「DeepRacer」の実走待ち時間は一時180分になった。

千葉県の幕張メッセで6月12日~14日の3日間開催される「AWS Summit Tokyo 2019」が開幕した。

会期中には基調講演やさまざまな事例セッションと展示が行われる。

注目の展示の1つに、アマゾンが2018年の自社カンファレンス「re:Invent2018」で発表した機械学習を学ぶためのAIロボットカー競技「DeepRacerリーグ」が開催される。会期を通してコースを完走するタイムを競い、トップのチームは今年のre:Invent2019に招待されるという太っ腹な企画だ。

国内初開催とあって参加希望者が殺到し、待ち時間は一時、180分になっていた。

DeepRacerとは?

deepracer

DeepRacerの実機。場内に用意された2つのコース脇には、それぞれ数十台の車両が用意されていた。

DeepRacerが一般的なラジコンと違うのは、「完全自律運転で動く電動ロボットカー」だということ。人間が操作するコントローラー類が一切ないのが特徴だ。

DeepRacerリーグの参加者は、「自分がつくった自律運転のAI」の運転のうまさ(=コースを周回する時間の早さ)を競うというシステムになっている。

deepracer-10

カメラでコースを認識し自律走行するDeepRacer。大きさはちょうどラジコンカーくらいのサイズ。

deepracer-13

カウルを外したところ。

「機械学習を使って自律運転AIをつくる」と聞くと非常に高度なプログラミング技術が必要そうだが、AWSの狙いはむしろ逆。機械学習の裾野を広げる「体験型教材」のように使えるものとして設計している。

AWS技術統括本部 本部長の瀧澤与一氏によると、実際、ただ走り始めるだけであれば、書くコードは画面に見える範囲のごくシンプルなもので済むという。

deepracer-15

現地でプレス向けに解説するAWS技術統括本部 本部長の瀧澤与一氏。実際の報酬関数のコード部分は、スライドで見える程度の行数しかなく、シンプルだ。

機械学習の手法としては、「強化学習」を使い、報酬関数の数値や設定を工夫することで、上手に走る自動運転AIをつくる。

報酬関数とは:人間の教育に当てはめると「褒める」ことにあたるのが報酬。ここでは、DeepRacerにやってほしい行動に対して高い報酬を与え、コースアウトなど失敗につながる行動には低い報酬を設定する、というように使う。

DeepRacerでの自律運転の「学習」は、すべてブラウザーのコンソール画面上から、バーチャルサーキットを走らせることで、学習を進めるようになっている。つまり、学習に実車は使わない。

パラメーターの設計がうまければ、自律運転AIは「成功した運転パターン」(報酬をたくさん得られた運転パターン)を自ら学び、コース一周の走り方を勝手に覚える。より優れたモデルをつくれると、より速くコースを走れる、ということになる。

deepracer-16

報酬関数の考え方。未知の真ん中を走ると高い報酬が得られる、というのが基本的な設計になっている。もちろん、これは自分のアイデアで別の数値にしてもかまわない。

deepracer-17

バーチャルコースで学習しているところ。

瀧澤氏によると、学習コストは1時間あたりおよそ3ドル(約325円)程度。現状のコンソールは学習の並列処理はできないようになっているため、必ずしも莫大な予算がある人が勝てる、というわけでもないという(ただし、よりたくさんの学習を試せる人が有利なのは確かだろう)。

アマゾンは具体的な地域別の参加者数は公表していないものの、関係者によるとランキングでは日本人と思われる参加者は目立っているという。

確かに、とあるバーチャルサーキットのタイムアタックランキングを確認したところ、上位100名のうち、約20名は日本からの参加者と思われるニックネームだった。

どうやったら上位ランカーになれる?

deepracer-23

取材時点のトップタイムは7秒台。@DNPという名前が入っている参加者がDNP関係者。

DeepRacerリーグの開幕初日、リアルタイム更新のランキングで目立ったのは、大日本印刷のシステム関連会社、DNPデジタルソリューションズ関係者の名前だ。

DNPは、社内の有志を集めて、サークル的にDeepRacerリーグに取り組んでいる。人数は総勢30名ほど、ネット上のコミュニティーでの情報交換もしながら、週2ペースで集まって、最適化に取り組んでいるという。かなり本気で「勝ち」に行っている印象だ。

DNP大野さん

大野史暁さん。普段はDNPデジタルソリューションズでアプリ開発のエンジニアをしている。機械学習はまったくの素人だったそうだが、DeepRacerリーグを機会に学び始めた。

初日の取材時点でトップ5に入っていた大野さんに話を聞いた。

この日、Summitコースを9秒380で走った自律運転モデルは、学習時間は5~6時間程度。思ったより短い。ただし、複数のパラメーター違いの自立運転モデルを同時並行でつくり、成績の良いモデルを残していく戦略をとっている。

バーチャルコースとリアルコースを違いは?と聞いてみると「このモデルはリアルコースの方が早く走れます」と語る。バーチャルに特化したモデルにするなら、際どい走り方をするように学習したほうがいいが、それではリアルで走れなくなってしまうらしい。

また、DeepRacerリーグの参加者数名に話を聞いたところ、ある程度共通しているのは「学習させすぎないこと」。過学習するとかえって遅くなる、というのはAWS側が公開している資料でも言及している。

deepracer-25

タブレットを持っているのが参加者。コース脇でDeepRacerと一緒に歩いているのがスタッフ。コースアウトする車両が多く、壁に激突しないようにスタッフが走り回るのが大変そうだった。

また、ある上位参加者は、実車で走る場合は、報酬関数はほぼ標準のままで、あまり大きくいじらない、とも言っていた。

大野さんのコメントで感心したのは、左コーナーが多いSummitコースだけで学習すると右コーナーが不得意なモデルになる、という指摘だ。現在6種類あるバーチャルコースのいくつかを使って、右コーナーの学習もすることで対策できるという。

機械学習の教材としてのDeepRacer

当初は計算リソースをブン回せる予算が多い人たちに有利なのかと思っていたが、参加者に聞く限りでは、どちらかというと「戦略」や「アイデア」で速くなる部分も大きいことがわかった。

1つ言えるのは、現時点では実車でコースを走るにはSummitに参加するしかないため、情報収集が非常に重要な要素になっているということだ。

その点でたくさんのアイデアを集めたり、海外のSummitに遠征した人から実車のフィードバックが得られる「チーム戦」での戦い方は、間違いなく有利だろう。

deepracer-26

DeepRacerの仕様。アメリカ版の価格は399ドルだが、カメラ搭載、バッテリー2台(モーター用とプロセッサー用)、各種環境つきでこの内容ならかなりお手頃だ。

DeepRacerの実車はアメリカで7月10日に発売予定。価格は399ドル(約4万3000円)と比較的手ごろだ。なお、AWS Summit Tokyo2019会場で走っている車両は、当然ながら既に国内の無線電波の認証(技適)をクリアしているという。AWSの瀧澤氏は、国内販売は年内にも開始したいと、前向きに語っていた。

AWS Summit Tokyo2019におけるDeepRacerリーグの優勝者は1最終日14日の夕方に発表される。

(文、写真・伊藤有)

ソーシャルメディアでも最新のビジネス情報をいち早く配信中