出典:マイクロソフト
マイクロソフトは12月3日の国際障がい者デーにあわせて、アクセシビリティへの取り組みのひとつである、視覚障がい者向けアプリ「Seeing AI」の日本語対応版をリリースする。iOS向けのApp Storeから無料で入手できる。
「Seeing AI」は、カメラで捉えた映像を音声で読み上げることができるトーキングカメラアプリ。チャンネルを切り替えることで、テキストや製品、人、通貨など、読み上げる対象物を絞り込めるしくみだ。
「Seeing AI」のiOSアプリ。原稿執筆時点では英語の説明のみだが、日本語対応版の配信が始まる。
撮影:伊藤有
たとえば「人チャンネル」では、あらかじめ登録されている友人の顔を認識することも可能。外観だけでなく、表情まで読み取って、教えてくれる。
ドキュメントチャンネルでは、新聞や雑誌、レストランのメニューを音読。見出しだけを読み上げるといったこともできる。さらに写真を読み込んで、指で触れたところに何が写っているのか解析し、読み上げる機能も備えている。
今回この読み上げの言語が英語に加えて、ドイツ語、スペイン語、フランス後、オランダ語、そして待望の「日本語」に対応した。さらに「通貨チャンネル」では、日本の紙幣を認識することもできるようになった。
「Seeing AI」プロジェクトチームのメンバーで自身も視覚障がいを持つ、ソフトウェア エンジニアのサーキブ・シャイフ氏に話を聞いた。
ハッカソンからスタートし、AI研究の最先端との協業でドライブ
「Seeing AI」プロジェクトチームのメンバーで自身も視覚障がいを持つ、ソフトウェア エンジニアのサーキブ・シャイフ氏
出典:マイクロソフト
「Seeing AI」の開発プロジェクトは、マイクロソフトが毎年グローバルで開催しているハッカソンから誕生した。
7歳のときに視力を失ったシャイフ氏。カメラを使って周りにあるものを認識し、声で教えてくれるデバイスのアイデアは、エンジニアを志した学生時代から温めていたものだという。
「私がエンジニアという仕事に惹かれたのは、テクノロジーによって平等な世界への扉を開くことができると考えたからです。しかし当時は、まだほんの基礎的な技術しかありませんでした」
2014年マイクロソフトが全社的に開催した最初のハッカソンで、シャイフ氏は自身のアイデアを再考し、AIを用いて視覚障がい者をサポートするというコンセプトを発表する。
一方その頃、マイクロソフトリサーチ(マイクロソフトの研究所)では、AIを用いて「画像の中から正確にオブジェクトを認識する技術」や「認識したものを言語化する技術」がブレイクスルーを迎えようとしていた。
2015年の2回目のハッカソンを経て、シャイフ氏のアイデアはマイクロソフトリサーチチームとの協業へと発展。「Seeing AI」の開発は、彼の日常の業務となった。
「元々は趣味で始めたようなプロジェクトでしたが、自分の経験が新しいソリューションを生み出すことにつながるなんて、私は本当にラッキーだと思います。これも優秀なチームメンバーにも恵まれたおかげ。
人々をエンパワーメントできる、Seeing AIのような技術に携わることができて、チーム全員わくわくしていますし、多言語対応となったことでより多くの人に使ってもらえればうれしい」
見えなくても「撮れる」。フレームに対象物を納めるナビ機能も搭載
写真は、視力に障がいをもつ石井暁子さん。30歳のときに手術がきっかけで視力を失った。石井さんは夫と共同で、一般社団法人セルフサポートマネージメントも運営。代表理事を務める。Seeing AIを利用しており、日本語対応になったことで手紙が自分で読めるようになるのがうれしい、とコメントしている。
出典:マイクロソフト
Seeing AIでは、被写体が何才くらいで、どんな表情(感情)をしているかといったことも教えてくれる(写真では、「幸せそうな黒髪の4歳の女の子」と表示)。日常の困難への気づきが反映されているのは、視覚障がいをもつ開発者が主導しているからこそだろう。
出典:マイクロソフト
開発において最もこだわったのは「視覚障がい者にとって、本当に良い体験を提供すること」だという。
例えば視覚障がいのある人にとっては、フレームの中に対象物を収めること自体が、そもそも難しい。しかしAIで映像を解析するためには、対象物が読み取れる状態でなければならない。
「そこでたとえば“ドキュメントチャンネル”では、書類の角がフレーム内に収まるように音声でガイドするといった機能も用意しています。
また明るさも自分では確認できないので、光量がしっかり確保できるようライトを自動的にオン/オフするといった工夫もしました」
Seein AIの主な機能。人や色、通貨などさまざまなものを、利用者の「目」となって認識してくれる。
出典:マイクロソフト
機能の中には「ユーザーのフィードバックを反映したものも多い」とシャイフ氏。テクノロジーによるアクセシビリティーの実現には、ユーザーの声に耳を傾けることが何よりも重要だという。同時に「開発者にとって、ユーザーの声を聞くのは何より楽しいことです」とも話す。
「ある学校の先生は、Seeing AIを使って生徒が部屋に入ってきたらわかるようにしていると話してくれました。またあるサッカーファンの方は、テレビに表示されるスコアを知るためにアプリを使っているそうです。
ユーザーひとりひとりが今どのような課題に直面しているのか、その課題を解決するためにどのような技術が必要なのかにひとつずつ取り組みながら、学生の頃に思い描いたビジョンに向かって進んでいければと思います」
日本語に対応することで、日本語の書面や書籍を読み上げることもできるようになる。
出典:マイクロソフト
そのビジョンとは「友人や家族が今自分にしてくれているようなことを、テクノロジーの力で可能にする」というもの。
自分の周りで今起こっていることを詳細に知ることができ、たとえば何かおもしろい音がしたら、何の音?と尋ねられる……そんな世界を実現したいと語る。
もし、それがサングラスのように身につけられるデバイスで可能になれば、まさに、テクノロジーによって平等な世界への扉を開くことになるかもしれない。
しかしシャイフ氏は「人間にガイドしてもらうのと同じくらい信頼できるものになるまでには、まだ多くの時間がかかるだろう」とエンジニアだからこその、現実的な見解も口にする。
「ひとつ言っておかなければならないのは、テクノロジーが進化しても、それが完全に人間に置き換わることはないということです」とシャイフ氏。
「テクノロジーはギャップを埋め、アクセシビリティーを実現する手助けになると我々は信じています。しかしアクセシビリティを実現することと、(障がいの有無にかかわらず互いに認め合い能力を発揮できるような)“インクルーシブな社会”を実現することとはまた別の話です」
シャイフ氏が言わんとするのは、視覚障がいがAIによっていきなり解決する、というような世界はまだ来ない、ということだ。Seeing AIのようなテクノロジーは、先天的あるいは手術や事故で後天的に障がいを持つ人たちが、社会に出てもっと活躍する手助けをするもの。
そのとき、健常者たちも、個性の違いを認め、働く環境そのものを変えていくことが必要だ、というのがシャイフ氏の主張だ。
「例えば企業の経営者であれば、さまざまな個性や背景を持つ人々に向けて、仕事のやり方を適用させるといったことも考える必要があるでしょう。そうすることで障がいのある人達も、良い社員としてその実力を発揮できると思います」
(文・太田百合子、写真協力・マイクロソフト)