高度な知識は不要、グーグルのサービスを利用した“ウォーリー”を4.5秒以内に探し出すロボット

「ウォーリーをさがせ!」5秒以内に探せないと、ロボット「There's Waldo」には勝てない。

「ウォーリーをさがせ!」5秒以内に探せないと、ロボット「There's Waldo」には勝てない。

YouTube/redpepper

  • ある企業は「ウォーリーをさがせ!」のどのページでも、おそらく人間より早く、ウォーリーを探し出すことができるロボットを作成した。
  • ロボット「There's Waldo」は画像認識と機械学習を使ってウォーリーを探し出す。
  • 所要時間は、4.5秒以内。

クリエイティブエージェンシーRedpepperは、先端にカメラを取り付けたロボットアームを作り、それをグーグルの機械学習サービスAutoMLにつないだ。どのページを開いても、ウォーリーを探し出すことができる。

クリエイティブエージェンシーRedpepperは、先端にカメラを取り付けたロボットアームを作り、それをグーグルの機械学習サービスAutoMLにつないだ。どのページを開いても、ウォーリーを見つけることができる。

YouTube/redpepper


ロボット「There's Waldo」は95%以上の信頼度でウォーリーの顔を判別すると、アームを動かし、少し不気味な指先でウォーリーの顔を指し示す。

AIロボット「There's Waldo」は95%以上の信頼度でウォーリーの顔を判別すると、アームを動かし、少し不気味な指先でウォーリーの顔を指し示す。

YouTube/redpepper



ラズベリーパイ(Raspberry Pi)で制御されているロボットアームは、パイソン(Python)でプログラミングされ、まずアームを伸ばして「ウォーリーをさがせ!」のページの写真を撮る。

ラズベリーパイ(Raspberry Pi)で制御されているロボットアームは、パイソン(Python)でプログラミングされ、アームを伸ばして「ウォーリーをさがせ!」のページの写真を撮る。

YouTube/redpepper


次にラズベリーパイに搭載されたOpenCV(パイソンで画像処理を行うためのプログラム)がページ上のすべての顔を認識し、ひとつひとつに分ける。

ページの写真を撮影した後、OpenCV(パイソンで画像処理を行うためのプログラム)がページ上のすべての顔をひとつずつ認識する。

YouTube/redpepper


そして画像をグーグルのCloud AutoML Visionに送る。画像は事前に学習済みのウォーリーの画像と比較される。

そして顔の画像をグーグルのCloud AutoML Visionに送る。顔の画像は事前に学習済みのウォーリーの画像と比較される。

YouTube/redpepper


グーグルのCloud AutoML Visionはプログラミングの知識がなくても、機械学習を使った画像認識モデルを構築できるサービス(しかも無料で試すことができる)。今回のケースでは、グーグルの画像検索で見つけた数十のウォーリーの画像と比較するよう学習済み。

グーグルのCloud AutoML Visionはプログラミングの知識がなくても、機械学習を使った画像認識モデルを構築できるサービス(しかも無料で試すことができる)。今回のケースでは、グーグルの画像検索で見つけた数十のウォーリーの画像と比較するよう学習済み。

YouTube/redpepper


画像が95%以上の信頼性で一致した場合、その画像の正確な場所までアームを伸ばし、画像を指し示すようプログラミングされている。

画像が95%以上の信頼性で一致した場合、その画像の正確な場所までアームを伸ばし、画像を指し示すようプログラミングされている。

YouTube/redpepper


Redpepperによると、ロボット「There's Waldo」はプロトタイプに過ぎないが、どのページでもウォーリーを4.45秒以内に探し出すことができる。

Redpepperは「There's Waldo」はプロトタイプだが、どのページでもウォーリーを4.45秒以内に探し出すことができると述べた。

YouTube/redpepper


動画は以下。



[原文:This robot can find Waldo in any 'Where's Waldo' puzzle as little as 5 seconds — here's how it works

(翻訳、編集:増田隆幸)

ソーシャルメディアでも最新のビジネス情報をいち早く配信中