グーグルのCEO、スンダー・ピチャイ(Sundar Pichai)。グーグル・アシスタントの製品イベントにて。
AP Photo/Eric Risberg
- 今年初めの国連による調査が、グーグル・アシスタントやアップルのSiri、アマゾンのアレクサ(Alexa)といった音声アシスタントに女性の声を使うと、性差別は進む一方だということを示唆した。
- グーグルによると、同社はグーグル・アシスタントに着手した際、男性の声も追加したかったが、技術的に女性の声にする方が容易だったという。
- グーグルは現在、ウェーブネット(WaveNet)と呼ばれる、より優れた、より高性能なテクノロジーを使っており、グーグル・アシスタントへの音声(男性の声を含む)の追加が容易になっている。
今年初め、国際連合教育科学文化機関(UNESCO:United Nations Education, Scientific and Cultural Organization)の調査が、アップル(Apple)のSiriやアマゾン(Amazon)のアレクサ、グーグル・アシスタント(Google Assistant)といった音声アシスタントの声の初期設定がすべて女性ということが「悪しき性差別」を長びかせている、ということを指摘した。
この調査には、過去に同様のことを示唆した他の調査と同じ点を指摘している。音声アシスタントの女性の声は、女性はアシストするために存在するという、時代錯誤な差別を長びかせる可能性があるということだ。
質問したり命令したりすると、スマート・アシスタントは女性の声で応じる。この感じは、女性が男性に対して補助的な役割を果たしていた時代を思い起こさせる。
グーグルの場合、当初はグーグル・アシスタントを男性と女性の両方の声を使う計画だったことを明かしている。
「音声アシスタントに着手した当初、我々は男性の声を使いたかった」と、グーグル・アシスタントのプロダクト・マネージャー、ブラント・ワード(Brant Ward)は言う。
グーグル・アシスタントの開発当初、当時の音声読み上げ(TTS:Text to Speech)システムで単に女性の声の方が男性の声にするよりうまくいっただけ、とワードはBusiness Insiderに語った。
「女性の声の方がTTSのパフォーマンスがよかったからだ。初期のTTS システムは女性の声の方が合っていた。そしてさらに女性の声に合わせて調整されていった」
具体的には、通常は女性の声の方が高音であるため、初期のTTS システムでは認識しやすかった、周波数への対応が今よりも狭かったからだ、とワードは言う。そして英語の場合、人工の音声は、女性の声の特徴を持っていると認識しやすかった。
アマゾンのスマート・アシスタント、アレクサも、女性の声でスタートした。スマート・アシスタントが女性の声なのは単に、一般的に女性の声の方が気持ちが良いからだという考えが、性差別を長引かせているという以前の調査に対し、同社は次のように応じた。
「我々がリサーチを行った結果、女性の声の方が『思いやりがあり』、受けが良いということが分かった」とアマゾンのスマート・ホーム(Smart Home)部門のトップ、ダニエル・ラウシュ(Daniel Rausch)は、昨年9月にBusiness Insiderのインタビューで述べた。
我々はアップルにも、Siriが発売時に女性の声だったことに何か理由があるのか尋ねたが、回答はなかった。
グーグルは、今ではグーグル・アシスタントの最初のバージョンで使われていた古いTTSシステムを使っていない。グーグルの子会社で、イギリスにあるAI(人工知能)企業の、ディープマインド(DeepMind)が開発した、ウェーブネット・テクノロジーに移行したためだ。ウェーブネットはより高性能なシステムで、グーグル・アシスタントにより多くの音声を追加することが容易になっている。
現在、アメリカのグーグル・アシスタントには11種類の音声があり、性別も選ぶことができる。
9月18日(現地時間)、グーグルは新たな音声をリリースすると発表。ドイツ語、フランス語、オランダ語、ノルウェー語、日本語、さらには英語をイギリスやインドのアクセントで話す音声も含まれる。なお、イタリア語と韓国語については、現状は男性の声のみのため、初めて女性の声が追加される。
(翻訳:Ito Yasuko、編集:Toshihiko Inoue)