ドワンゴ川上会長単独インタビュー「僕らがディープラーニングで狙うもの」

「深層学習(ディープラーニング)によるAIの活用が、次のビジネスを大きく左右する」と言われて久しい。

KADOKAWAと経営統合した、ニコニコ動画の運営で知られるドワンゴも、社内に研究所を持ち、ディープラーニングに本格的に取り組んでいる企業のひとつだ。映像配信やコミュニティ運営がビジネスの軸であるドワンゴはAIをどのように活用しようとしているのか。川上量生会長の単独インタビューを通して見えてきた姿は「AIという道具の活用方法」だった。

ドワンゴ川上社長

ドワンゴ川上社長


脳を模して自ら学ぶ「ディープラーニング」

ドワンゴは、2014年10月に、自社の研究部門である「ドワンゴ人工知能研究所」を設立した。以来ディープラーニングの研究を続けている。ドワンゴの戦略を考える前に、AIの基本的なところからおさらいしておこう。

2000年代前半までのAIでは、人間がまず「判断するためのルールや特徴」を示す、俗に「ルールベースによる推論」と呼ばれる手法が多く使われていた。この手法の難点は、良いルールを作るのがきわめて難しい、という点にある。精度の高いルールを作ると確度は上がるが、応用範囲が狭まり、知性的な振る舞いをしなくなる。演算能力とデータ量の増大で性能は向上していったが、それでも「想定範囲を超えるような能力」を発揮できない。能力向上が踊り場にさしかかり、人間のような推論・認識は難しい……と言われてきた。

だが2010年代に入り、そこに劇的な変化をもたらす技術が登場する。「深層学習(ディープラーニング)」だ。ディープラーニングでは、人間の脳の仕組みを真似た「ニューラルネットワーク」という手法を使う。大量のデータからAI自身が学び、(専門的な言葉になるが)ある「特徴量」を自ら見つけ出し、抽象化を行う。

例えば映像の内容を認識する、としよう。

人間はさまざまな特徴から概念を学習し、「これはネコだ」と判断するわけだが、ニューラルネットワークベースのAIでも、学習による特徴量抽出から同様に「これはネコである」という概念を見つけ出せる。

とはいえ、そのような精度の高い特徴量抽出には膨大な演算が必要になる。理論上の可能性に過ぎない時代が続いたが、近年、コンピューターのCPU・GPUによる処理能力の爆発的な向上が、その常識を覆した。その結果は、まず音声認識・画像認識・自動翻訳の劇的な進化として現れている。

いますぐビジネスに直結させることは考えていない(川上)

川上会長(以下敬称略):今の段階では、(ディープラーニングを)ビジネスに直結させることは考えていません。この分野は世界的に革新が進んでいるので、まずはキャッチアップし続けることが大切。役に立ちそうなところ、本格的なビジネスチャンスが到来したら、すぐに動けるようにいろいろと試しにやってみている、というところでしょうか。

では、完全に「まだ先のもの」なのか、というとそうではないという。

川上:弊社内では、すでにディープラーニングを使って、年間に1億円以上の人件費削減効果は出ています。現在、ニコニコ動画に書き込まれる「ネガティブコメント」の削除には、ディープラーニングベースのAIを使っています。ディープラーニングを使わない、既存の手法だとネガティブコメントの自動抽出精度は70%くらいだったのですが、ディープラーニング導入後には80%になり、直近では90%を超えています。

実際に導入してはいないのですが、ニコニコ静画に投稿されたイラストの“内容”から、そのイラストが最終的にどのくらいの閲覧数になるかを、かなりの精度で推測できるようにもなりました。絵の内容から自動的に判断できるのですが、これはなかなかすごいことだと思うんですよね。

AIの閲覧数予測

投稿されたイラストをAIが見て、どのくらいの閲覧数になるかを予測。実際の閲覧数と予測値の乖離は意外と小さい。

提供:ドワンゴ

実験的に手がけているプロジェクトで、川上会長が面白いと評価しているのが「人工生命」だ。コンピュータの中で体を与え、それが環境の中でどう動くかを学習させていくものだ。動きを生成し、それをエンターテインメントに活かそうとしている。

川上:ただ、今は人工生命の動きの学習にはディープラーニングは入れていません。ディープラーニングにすると、「きちんと動く」ようになって、面白くなくなっちゃうんですよね。局所解を見つけたほうがいい。物理法則にかなっていながら、見たことのない動きになる。ここは、ディープラーニングを使わない従来型の機械学習でやった方が面白い動きになります。

この人工生命のエピソード、なんとなく聞き覚えがある方もいるだろう。2016年11月13日に放送されたNHKスペシャル「終わらない人 宮崎駿」で、宮崎駿氏に川上会長らが諌められるシーンがあったが、あのエピソードこそが、この人工知能である。人間的なAIを使うと人間的になり、そうでないものだと異質なものになる、という点は、ある意味面白い気づきだ。

人間はさほど「知的」ではない!?

ディープラーニングは、自ら学習して特徴量を見つけ出す。その特質上、「大量のデータが存在しないと学習効果が上がらない」「処理には高い演算能力が必須」という2つの欠点がある。Googleやマイクロソフト、アップルにAmazonなど、「クラウドとネットワークサービスの巨人」的な企業がディープラーニング研究で先行しているのは、演算能力とデータ量の両方で、高い水準を満たせるからである。ドワンゴは国内有数のIT企業であり、利用するユーザーの数も多いが、それでも、Googleなどに比べれば、圧倒的に不利である。

川上:確かに、データ量も演算能力も大きいに越したことはありません。しかし、演算リソースの多寡は、そこまで大きな問題にはならないですよ。(なぜなら)ビジネスターゲットにするのは「人間が処理している」こと。その程度なら、そこまで大きな演算能力も、本当の意味での「ビッグデータ」も不要です。

現在のAIは、どれもまだ人間の能力に追いついていない。例えば音声認識にしても画像認識にしても、「人間に勝てない」という印象を持っている人の方が多いはずだ。そこから考えると、この川上会長のコメントは意外なものに思える。しかし、もちろん根拠は存在する。それはドワンゴが開発する「囲碁AI」から得られた知見だ。

DeepZenGo

ドワンゴが日本棋院と共同開発している「DeepZenGo」。すでに世界3位の実力をもっているという。

提供:ドワンゴ

川上:弊社が開発中のDeepZenGoは、今世界で3番目に強い囲碁AIです。上には「AlphaGo(Google)」と「絶芸(テンセント)」がいます。

コアな部分ではDeepZenGoは決して劣っていない自信があります。 ですが、決定的に違うのは、機械学習に使える計算資源。トップ2社とは、使っているコンピュータの台数が推定で100倍くらいは違う(笑)。こういう領域ではなかなか勝つのは難しい。

とはいえこれは、現実の世界で人間が行っている情報処理は囲碁ほど複雑なことはやっていないし、また、求められてもいない。囲碁は勝ち負けが明確に定義できるから人工知能の競争も際限がなくなるだけです。人間が行っている多種多様な行動に必要とされる情報処理の多くは、それほど複雑なものではなく、また、勝ち負けとかは存在しないものがほとんどです。“できるか、できないか”だけなのです。それならば、ひとつひとつのAIが行うことは「人間と同じレベルでいい」わけですから、そこまで演算量も必要ないし、みなさんが思うほどデータ量も必要ない。

国立情報学研究所が開発している「東ロボくん」というAIがありますよね? 東京大学の入試に合格できることを目的に開発されていたものですが。あれはディープラーニングなんか使ってなくて、パターンマッチングで解答を予測したりしているので、問題文の意味なんて理解していない。しかし、あれですら、大学受験する高校生の大半よりも優秀なんです。人間がやっている「知性的なこと」というのは、実はたいしたことはない。日常的な行動のコアの部分の情報処理は、とっくにAIで代替可能なレベルのことしかやっていないのです。

東ロボくんの公式サイト

東ロボくんの公式サイト。プロジェクトは2011年にスタート。国公立33大学、私立441大学で合格率80%以上というところまで来たが、2016年11月8日、読解力に問題があるため東大合格の断念を発表。今後はこれまでの成果を子ども達の読解力を向上させる研究にいかしたいとしている。

実はもう1点、注意すべきことがある。「圧倒的なデータ量と演算量を必要とするAIの領域」は、やはり厳然と存在しており、人間はその領域を「基礎的な部分」として使っている、ということだ。今、川上会長が言った「知性的なこと」はその上に来る部分である。

川上:音を認識する、視覚的に認識する、といった圧倒的な演算力を必要とするような部分は、汎用品として提供されたものを利用すればいいと思います。それらのAIは少数のすごい会社が開発してくれればいいんです。

映像や音声の認識のような、人間が「常識」として使っている部分はクラウドの巨人に任せ、ドワンゴはそこに踏み込まない。その上に来る「さまざまな判断」のためのAIを提供することにビジネスチャンスがあるのではないか……と川上会長は考えているのだ。

ディープラーニングは「勘」をデータ化する

ここで、川上会長は意外な言葉を口にする。

川上:ディープラーニングは人間社会を変革する画期的な技術ということだけではなく、人間が世界を理解するために使っている概念すらも書き換えると思っています。

これまで別の言葉や理論で説明されていた事柄をディープラーニングがもたらした概念によって、新しい見方で解釈されるようになると思います。人文学系の学問も人工知能がもたらした知見で解釈しなおすことが、今後、起こるでしょう。

例えば心理学とかの概念って、わりと観念的で本当にあるのかとらえどころがないものが多いと思いますが、そういうものも人間の大脳のなかに生得的に生みだされる、あるいは経験的に獲得する特徴量であるという解釈がされるようになるのではないでしょうか。

突飛な話のように思えるが、ディープラーニングは人間の脳の情報処理を参考にして発展してきた部分が大きい。逆にディープラーニングのモデルを使って人間が行なっている情報処理を解釈して説明するということも確かに可能だろう。

川上:これまで説明に苦労していたもの、例えば「長年の勘」とか「無意識」には、2通りの解釈が可能だと思っているんですよ。

ひとつの解釈は「人間の脳の中に存在しているが、言語空間にマッピングされていない特徴量である」ということ。

もうひとつは「学習がうまく収束していなくて、特徴量がはっきり現れていない状態である」ということです。

人間がこれまでコンピュータにはできないと思ってきた「人間にしかできない仕事」というのは、ほぼ、このふたつのパターンの組み合わせで説明がつくと予想しています。特に後者のパターンは盲点になっていると思っていて、「達人」と呼ばれる人々が存在している分野の多くは、実は最適化が進んでいない仕事が存在する領域である、といったケースが、想像以上に多いのではないでしょうか。

実はここで、「人間の知的な行為を再現する程度なら、データ量は少ない」という論に戻ってくる。

川上:達人がやっていることは、データ依存量は少ないと思うんです。簡単ないくつかの法則を体得した人が“達人”と呼ばれている。そういう少数の部分をデジタル化するだけで、AIが人を抜き去ることができるジャンルが世の中のほとんどだと思います。

その一例として、川上会長は「まだ研究中で、実現はしていないが」と前置きした上で、次のような予想を語った。

川上:競馬のレース結果の予想をディープラーニングでできないか、休日に趣味で試している社員がいるんです。現在は調教でのタイムやレース結果だけを予測に使っているのですが、それでも、これまでの世の中にある予想ソフトを上回る精度の予測ができているそうです。

競馬の風景

Mikhail Pogosov/shutterstock

開発している社員に言わせると、今欲しいのは「馬の画像データ」だそうです。馬を見るだけで「あの馬は走るよ」と予言できる人間が存在するじゃないですか。そういう人はどういう学習の元に、馬を見ただけで走る馬かを分かるようになったのかというと、馬をたくさん見たからに決まっています。

じゃあ、画像データさえあれば、その過程をディープラーニングで再現できる可能性が高い。要するに、「勘に使ったと思われるデータを見つける」ことができるのであれば、AIで再現できるわけです。その際にひとりの人間が一生で見ることができるよりもたくさんの馬の画像データをコンピュータに学習させれば、人間の能力も超えるAIが作れる可能性が高い。

このようなパターンでAIが人間を代替する領域が増えていくというのが、これからの世の中で起こることです。

勝負は「教育とエンタメ」、でも詳細は秘密

では、ドワンゴはディープラーニングのどこを大きなビジネスにしようとしているのだろうか?

川上会長は「教育とエンターテインメント」と言い切る。ドワンゴはKADOKAWAグループの一員であり、ニコニコ動画を軸にしたエンターテインメントの会社だ。だから、エンターテインメントをビジネス化するのはよくわかる。では「教育」を挙げる根拠はなぜか?

川上:今のディープラーニングは「人工知能の教育産業」、すなわち、人工知能にどういう教育を受けさせれば良い結果が得られるか、ということを競って研究していると考えられます。最終的には「さまざまな知性に対する汎用的な教育理論」というものが作ろうとしているといってもいい。そして、その特殊な部分解として「人間の知性への教育理論」というものも分かってくる……というのが僕の予想です。

ディープラーニングは、そもそも人間の神経回路を真似たニューラルネットワークに対する学習手法である。ならば、その先に「人間の脳というニューラルネットワーク・アーキテクチャ」に最適化された学習が存在し、それこそが「人間の教育」である……という発想だ。そして、教育がビジネスとして有効である、という分析にはもうひとつの理由がある。

川上:教育だと、グーグルとの競合を避けられる可能性があります。なぜなら、少なくとも日本国内向けの教育産業には非関税障壁が数多く存在しますから。

川上会長は「汎用的な認識については『ありもの』を使う」と言った。そこはまさにグーグルがいる場所だ。ディープラーニングというと「汎用認識のための知性」で戦おうとする企業が多いが、結局その領域でものを言うのは、圧倒的なデータ量、そして演算能力(=資金力)だ。演算能力は“計算資源”とも言われるように、限りなく資金力の勝負になる。その領域で互角に戦うには、先を行くグーグルやFacebook 、アマゾンといった企業と同じだけの資金を投じて戦うことになる。ドワンゴは彼らとは戦わない道を選ぶ、ということだ。

だが、教育については、ドワンゴもまだ新参もので、「参入障壁」と戦う立場にいる。教育のどの分野に、どう入っていくかもわからない。同様に、本業に近いエンターテインメントにディープラーニングをどう活かすかも、語らない。

「そこはまだ秘密です」

川上会長は笑いながら話す。今は、内部での試行錯誤を繰り返す日々が続いている。


西田宗千佳: フリージャーナリスト。得意ジャンルはパソコン・デジタルAV・家電、ネットワーク関連など「電気かデータが流れるもの全般」。主な著書に「ポケモンGOは終わらない」「ソニー復興の劇薬」「ネットフリックスの時代」「iPad VS. キンドル 日本を巻き込む電子書籍戦争の舞台裏」など 。

ソーシャルメディアでも最新のビジネス情報をいち早く配信中

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい