誰も知らない、アマゾンが実用化した驚きの技術、その裏側【re:MARS】

bezos-4

創業者のジェフ・ベゾス氏が登壇するセッションなど、まさにアマゾンの最新事情を垣間見ることのできるイベントだった(タップすると、登壇レポート記事に遷移します)

米アマゾンが6月4日から7日まで、ラスベガスで開催した「re:MARS」では、アマゾンのトップエクゼクティブが続々登場し、「アマゾンを支えるテクノロジー」を一気に解説した。

特にここでは、4つのコア先進テクノロジーである、「ロボティクス」「Amazon Go」「Alexa」、そしてドローン配送「Prime Air」についてみていこう。

Amazon Goの狙いは「無人」「省力化」ではない

アマゾンが展開するレジなし店舗「Amazon Go」。日本では「無人」「省力化」目線で語られることが多いが、Amazon Go バイスプレジデントのディリップ・クマール氏の語る内容に「省力化」という言葉は一切なかった。

Amazon Goのキャッチフレーズ

Amazon Goのキャッチフレーズは「Just walk out」。Amazon Go バイスプレジデントのディリップ・クマール氏が開始の意図や開発の流れを語った。

「計画を始めるにあたって、我々はあらゆる店舗を分析した。いろいろなものが売られていて、その特性も業種によって大きく異なる。だが、どの店舗についても、顧客の感じる不満は同じだった。それは“レジに並びたくない”ということ。そこを改善し、足止めされることのない買物体験を作ることが重要と考えた」

つまり、レジに人がいないのは行列を減らして買物体験を変えるためであり、省力化目線ではないのだ。

とはいえ、その実現は簡単ではない。

Amazon Goでの「認識」は、ほとんどが頭上にあるカメラで行う。写真は、店舗の中でカメラが認識している顧客の動きを可視化したものだ。

ポイントは、ここまでやっていても「顔認識は使っていない」ことだ。店舗の中で顧客がどう動いたかだけを認識しており、そのために、体の動きなども把握している。何を棚から取ったのか、ということもポイントだが、その人の頭と動きの両方から個人を特定している。

店舗内での人の動きの認識例

Amazon Goの店舗内での人の動きの認識例。顔認識は使わず、上からのカメラで「誰がどう動いたか」だけを、店内に限定して追跡している。

開発中のテスト画像1

開発中のテスト画像。上にあるカメラで人の腕の動きなどを把握し、人の移動や商品を取る動作の認識に使っている。

しかも、品物の判別すら簡単ではない。商品パッケージなど常に同じ形……と思いがちだが、ポテトチップスの袋のように変形するものもあれば、同じ商品なのにパッケージがマイナーチェンジするものもある。そうした違いを人間と同じように判断する能力が求められた。

開発中のテスト画像2

どちらも同じ商品のパッケージだが、形が大きく変わる。これを人間と同じように、正確に認識する必要がある。

こうした認識技術は「店舗のサイズにあまり関係がない」とアマゾンは話す。比較的小さな店舗から大きな店舗まで、スケール(店舗面積の拡大)が容易な構造なのだ。

こうした技術の集積によって、「ただ歩いて出るだけ(Just walk out)」という目的を達成している。

Alexaはスタートレックから生まれた

アマゾンの、家庭内に入りこんだ巨大プラットフォームといえば、音声アシスタントである「Alexa」だろう。

Alexaのヘッドサイエンティストで副社長(VP)のローヒット・プラサード氏は、「Alexaはスタートレックのコンピューターにイマジネーションを受けて開発された」とその出自を語る。

Alexa のローヒット・プラサード氏とスタートレック

Alexa ヘッドサイエンティストのローヒット・プラサード氏は、Alexaのアイデアがスタートレックから生まれた、と明かす。

Alexaの精度アップ・賢さアップのために、アマゾンは主に2つの技術に取り組んでいる。

ひとつめは「ラベルなし学習」。

機械学習では、データに「ラベル」をつけることでそれをお手本(教師データ)にして学習していく手法が採られる。

だがこの場合、大量のデータにそれぞれ、「これは何か」を示すラベルを付ける作業が大変だ。このラベル付けは結局、人海戦術で行う場合が多く、コストの面でも手間の面でも負担だ。

そこで、ラベルのないデータから機械が勝手に学習を進める仕組みが研究されている。これを活かすことで、音声認識の精度をさらに上げることが可能だ。

ラベルなし学習例

ラベルのない大量のデータから学習する技術を生み出すことで、「教師」を増やし、より認識や分析の精度を上げる試みがなされている。

このことは、プライバシー保護にも重要な意味を持つ。アメリカでは4月に、Alexaに対して話した内容をアマゾンの従業員が聞いており、プライバシー上問題があるのではないか、との指摘がなされた。

この点を、アマゾンのデバイス事業の責任者であり、Amazon Devices 上級副社長のデイブ・リンプ氏は認めている。

ただし、「それはAIの学習のためのラベル付けのためであり、匿名化されていて、名前や場所にはアクセスできない。しかも、全体の1%程度をランダムに抽出して使っている。だから、報道はセンセーショナルすぎて正しくない」とも反論する。その上で、「ラベルのないデータからの学習が実現すれば、そうした問題も起きない」と話す。

「ちゃんと会話して注文」する音声AIの実現へ

次の課題は「スキルとの対話」だ。

Alexaではスキルと呼ばれる音声アプリが使われている。スキルを使うことで、Alexaそのものにはない機能、特に他社のサービスやハードウェアと連携する機能を追加していけるのがポイントだ。

だがスキルはまさに「音声コマンド」であり、特定の言葉しか通じない場合が多い。人になにかを頼んでやってもらうのとは異なり、不自然に細かく命令を与えるのは難しい。

実際には、そういう「対話型スキル」を作ることもできるが、現在は、想定される対話をすべてプログラミングする必要があり、開発負荷が高い。

それを解決するのが、「Alexa Conversation」という技術だ。

Alexa Conversationを使えば、機械学習によってAlexa自身が対話をするので、スキルを開発する企業は、ほんの少しのコードを書くだけで良くなる。

また、スキルを連携した機能の実現にも使われる。

「夜の映画に行く時、人は映画に行きたいだけではない。家から移動し、ディナーを食べて映画を楽しむ、という一連の体験をしたいのだ」とプラサード氏は話す。

Alexa Conversationの例

「映画を予約する」という行為にはさまざまな「夜の予定」が関連しており、それを対話しながら解決することを目指す。

Alexa Conversationでは複数のスキルを連携する「予測機能」を組み合わせることで、まさに「対話しながら」目的を達成することを狙う。このためには、スキル側でも連携を前提とした設計が必要になる。そのため、Atom・Uber・OpenTableが初期パートナーとして選ばれ、スキル開発が行われたという。

Alexa Conversationは、英語向けの開発プレビューが始まっており、パートナーはこうした対話機能を持つスキルの開発が行えるようになった。日本語への対応はまだだが、もちろんその予定はある、という。

世界中のアマゾンで20万台のロボットが働く

アマゾンは全世界に300の「フルフィルメントセンター」がある。アマゾンからの配送を担当する物流拠点だが、そこでは大量のロボットが働いている。その数は、なんと20万台を超える。

フィルフィルメントセンターの中では、荷物のピックアップなどにロボットが活躍している。人の側は動かず、ロボットがピックアップして人の方に動く。ロボットの動作とピックアップの最適化こそが、フルフィルメントセンターの核にあるテクノロジーだ。

そこでは、人とロボットは「別の強みを持つパートナー」として働いている、とアマゾンは主張する。

事故を排除するために作られたのが「Robot Safe」と呼ばれるベスト。これを付けていると、ロボットは近くに来ない。自動的にルートや仕事を変更する。人の側が気を遣うことなく、事故を防止するための仕組みだ。

Robot Safeの画像

アマゾンのファシリティ内で使われている「Robot Safe」。これを着て、事故が起こらないように人間も作業をする。

品物を最終的に配送に回すまでの分配にも、人はほとんど関わらない。

その最新の試みが、デンバーにある施設の中で新たに使い始めているという「Pegasus」というシステムだ。

デンバーの施設では、800台ものPegasusロボットが建物の中を走り回っている。

荷物を個別に施設内で運び、配送用のトレイまで移動するのがPegasusの仕事だ。Pegasusにより「仕分けミスが50%減った」とアマゾンは言う。

アマゾンは配送の確実性を上げようとしているが、そのためには、まず仕分けミスを極限まで減らすことが重要、という判断だ。

アマゾンが公開している動画。Pegasusについて解説している。

re:MARSでは、現在開発中の「Xanthus」というロボットも公開されている。こちらは、棚から箱まで、いろいろなものの配送に、アタッチメントの取り替えで対応できる幅広さを持っている。さらに、ファシリティの「外」での利用も想定されているという。

新しいロボット「Xanthus」

アマゾンが開発した新しいロボット「Xanthus」。より色々な配送の場面で活躍することを目指したモデルで、ファシリティの外での利用も想定されている。

数カ月以内に配送にドローンを投入

アマゾンのロボティクス技術のもうひとつの最先端がドローンだ。

商用配送サービス用ドローン

アマゾンが商用配送サービスに使うドローン。もちろん自社開発だ。

アマゾン・ワールドワイド・コンシューマ担当 CEOのジェフ・ウィルケ氏は、「いかに配達の確実性・迅速性を上げるかが重要な課題。そのためにさまざまな活動をしている」と語った。

アマゾン・ワールドワイド・コンシューマ担当 CEOのジェフ・ウィルケ氏。

ドローンによる商用配送を発表するアマゾン・ワールドワイド・コンシューマ担当 CEOのジェフ・ウィルケ氏。

その「最新の活動」こそが、ドローンによる配送である「Prime Air」だ。すでに本メディアでも既報の通り、アマゾンは数カ月以内に、実験でなく「商用」のサービスを開始する。

使われるドローンは、垂直飛行と水平飛行の両方ができる「ハイブリッド型」。まず垂直に離陸し、一定高度まで来ると自らを傾けて水平飛行に入る。これは、アマゾンのオリジナル設計で、風などの影響を受けても安定的に飛行できること、風切り音が不快にならないようにすることなどを考慮して設計されている。

もちろん自律型で、アマゾンのフルフィルメントセンターから目的地まで飛び、着陸し、荷物を降ろすと自動的に元へ戻る。

QRコードに似た二次元バーコードのマーカーを目印に着陸するが、マーカーの周囲に人や障害物を見つけると着陸を中止する。ステレオカメラを使って周囲を認識しており、電線のようなものも見分けて着陸の可否を判断するようになっている。

ドローンカメラ

ドローンはカメラでバーコードを目印に着陸するが、人やペット、障害物などを検知し、着陸するかどうかを自分で判断する。

騒音については「同じ距離にいるトラックより小さい程度」(ウィルケ氏)とされているが、ドローンの接近音で配達がわかる、というメリットもあるという。

このドローンは、フルフィルメントセンターから15マイル(約24.14km)圏内の顧客に、5ポンド(約2.26キロ)までの荷物を、30分以内に配送できる。料金体系や実施場所などは公開されていないが、「最短でのお届け」になるのは間違いない。

ウィルケ氏は「複数の規制当局や政府と協議をしている。安全性を最優先にサービスを進めていく」と説明しており、政府側と綿密に連携をとりながら、サービスを開始する予定だ。

(文、写真・西田宗千佳)


西田宗千佳:1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

ソーシャルメディアでも最新のビジネス情報をいち早く配信中

あわせて読みたい

Popular

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み