BI Daily Newsletter

東大発ベンチャー「マンガ特化型AI自動翻訳」リリース。海外での海賊版対策としても有効

セーラームーン

日本のマンガは、海外でも人気が高い。

撮影:稲葉結衣

「日本のポップカルチャーが言語の壁を超えて海外に届き、若者同士の交流が生まれる。個人的にそういった経験がありました。文化の交流みたいなことが、マンガを媒介として起こってほしい。それが事業を始めたモチベーションです」

そう話すのは、7月28日にマンガに特化した多言語翻訳システム「Mantra Engine」をリリースした東大発ベンチャー・Mantraの石渡祥之佑代表。

クールジャパンの象徴の一つであるマンガ文化。

同社が開発したMantra Engineは、マンガ文化の広がりを加速させる上で欠かせない1ピースとなる可能性を秘めている。

マンガの翻訳を約半分の時間で実現

翻訳シーン

翻訳画面のイメージ、左側が翻訳前で右側が翻訳後。フォントサイズの調整や翻訳者、編集者間でのやりとりのためのコメント機能など、ブラウザ上ですべての工程を完結するための仕組みが備わっている。

提供:Mantra

Mantraは、東京大学の学生・研究者らを対象にしたスタートアップ支援を行うFound Xや、東大IPC(協創プラットフォーム開発株式会社)の支援を受けて設立されたベンチャー企業。石渡氏自身、東大で自然言語処理などを専門とするコンピューターサイエンスの研究者だった。

2018年頃から事業の準備を始め、2020年1月に正式に会社を設立。5月には約8000万円の資金調達を発表している。

今回発表した多言語翻訳システム「Mantra Engine」最大の売りは、人工知能(AI)を用いた「マンガらしい表現」への自動翻訳。さらに、それらがすべて同じブラウザ上で完結することで実現されるスピーディーさだ。

Mantra Engineでは、出版社側がクラウド上にアップロードしたマンガの画像ファイルから自動的にテキストが認識されると、自社で開発した機械翻訳エンジンによって、指定した言語(英語、中国語に対応)の“マンガ的な”表現に翻訳される。

石渡氏によると、完璧な翻訳ができる割合は3割程度。

残り7割は、ちょっとした修正で済むものから大きく手を加える必要があるものまでさまざまという。翻訳の精度は、マンガのジャンルにも大きく依存する。

通常、マンガの翻訳版を出版する際には、翻訳者とのやりとりによって修正されたテキストデータを再びイラストの中に挿入していく工程(文字組版)といったデータのやりとりが発生する。

Mantra Engineでは、画像ファイルから文字を抽出・翻訳し、出力するまでがワンセットだ。出力されたデータはすでに「マンガの形」なっており、編集も可能な状態。データを移行しなくても、同じブラウザ上で翻訳者や校閲者によるチェックが完結するため、ワークフローが大幅に効率化される。

Mantraによると、マンガを翻訳するためにかかる作業時間が、通常時のおよそ半分にまで短縮できるという。

「マンガ特化」の意味

半分

提供:Mantra

それにしても、マンガに特化した機械翻訳とはどういうことなのか?

そもそもマンガには、吹き出しで表現されるキャラクターのセリフはもちろん、心理描写や効果音、背景など、複雑なテキスト情報が混在している。

また、マンガはコマ割りが複雑で、その順番もかなり自由度が高い。

これは、右上から左下に向かって文章の順番が決まっている小説などとは大きく異なる点だ。

私たちがマンガを読むときには、イラスト全体を見ながらなんとなく「正しい文脈」を理解しているが、コンピューターにとってその作業は非常に難しい。

例えば、1文が2つのコマや吹き出しに分かれているケースでは、単純に文字を認識して翻訳するだけでは、マンガの翻訳としては不十分だ。

Mantra Engineでは、「マンガらしい」翻訳を学習させることで翻訳の精度を確保しているだけではなく、テキストボックス、コマ割などの順番が分かる教師データをもとに機械学習を行うことで、マンガの画像データから「適切な文脈」を考慮した翻訳が可能となっている。

当然、イラストとテキストが混在したマンガから適切に文字を認識するためのOCR(光学文字認識)も、高い精度を誇る。

石渡氏によると、マンガのテキスト翻訳の精度、さらにOCRの精度においても、Googleの汎用的なAPIに比べて高い精度を記録したという。

石渡氏は、

「(テキストの翻訳自体を)マンガっぽくしたり、翻訳した文章の順番を入れかえて自然に表現できるようになったのが新しいところです。マンガの自動翻訳、文字認識という領域では、世界最高水準のものをつくっています

と自信をみせた。

「本質的に人間でなければできない領域はある」

石渡さん

Mantra代表の石渡祥之佑さん。

撮影:三ツ村崇志

すべての翻訳を自動で行えるようになるまでには、まだまだ課題も多い。

「固有名詞の扱い方は、本質的に変えなければいけないと思っています」(石渡氏)

マンガでは、キャラクターの名前や必殺技、地名などが固有名詞として登場するケースが多い。こういった単語を自動翻訳するのはかなり難しい。

例えば、週刊少年ジャンプの人気連載「NARUTO」の主人公の名前(ナルト)が、「boiled fish paste(魚のすり身)」などと訳されてしまっては興ざめだ。

あらかじめ作品ごとに「用語集」を作成しておくことで、こういった自動翻訳の事故を防ぐことができる。

「本質的に人間でなければできない領域はあると思います。固有名詞をどう訳すかというところは、人間が翻訳したほうが良い『クリエイティブな作業領域』だと思います」

技術が進歩していったとしても、すべてを完璧に機械で翻訳することは難しいのではないかと石渡氏は話す。

一方で、機械翻訳の高精度化については、まだまだ技術的に突き詰める要素はあるようだ。

「今、絵から取れている情報は、文章の順番や文章の関係です。もっと高度な文脈情報、誰が話しているのか、絵にどういうものが描かれていて、それに対して何を言っているかといった、人が無意識に行っている『高度な文脈認識』の技術を取り込んでいくことが、これからやっていきたいところです」(石渡氏)

同時配信で海賊版への流出を防ぐ

ドイツの本屋

ドイツ・デュッセルドルフの日本の書店で、マンガを手に取ろうとする若者たち。週末には、10代の子どもたちがマンガの棚の前に群がっていることもあるという。(撮影は2009年12月)

REUTERS/Ina Fassbender

機械翻訳は、コストの削減につながるのはもちろんのこと、「サイマル配信」を実現する上で欠かせない。サイマル配信とは、週刊誌などで最新話が出版されるのと同じタイミングで、電子版や他言語版などを同時配信する手法だ。

これはマンガ市場が抱える「海賊版問題」への対抗手段にもなるという。

日本では、2018年に違法アップロードサイト「漫画村」が大きな話題となった。出版社や業界団体による説明によれば、その被害額は3000億円を上回るとされている。海賊版問題は海外でも同様で、アメリカだけでも日本マンガの海賊版による被害額は1兆円規模になるという(諸説あり)。

国外で日本のマンガを販売する際には、海外の出版社にライセンスを譲渡した上で、翻訳・出版する場合が多い。この方法だと、単行本が出てから翻訳版が発売されるまでにタイムラグが生じてしまう。

しかし、マンガが発売されれば一刻も早く読みたいと思うのがファンの心理だ。その結果、正規品が海外で販売される前に、海賊版に読者を奪われる構造ができてしまう。

石渡さんは、「海外版の発売までのタイムラグが短くなればなるほど、海賊版の購入頻度は下るはず」と話す。

集英社のアプリ

Manga Plusでは、英語版、スペイン語で有名作を読むことができる。

撮影:三ツ村崇志

2019年1月、出版大手の集英社は、週刊少年ジャンプの掲載作品を中心に、英語とスペイン語の翻訳版をリアルタイムで無料公開するサービス「Manga Plus by SHUEISHA」をスタートさせた。正規の配信サービスが開始されたことで、海賊版の掲載に対するけん制にもなっている。

ただし、この集英社の取り組みは人の手を介して翻訳を行っている以上、作品数や言語数が増えれば、その分コストや翻訳速度の限界が出てくることは免れない。半自動で翻訳できるマンガ特化の翻訳技術に、今後大きな期待が寄せられることは間違いないだろう。

また、日本語から他言語に翻訳できるのだから、同じ技術を使って英語や中国語のマンガを日本語に翻訳することももちろん可能となる。

「日本は大きなマーケットなので、ここにさまざまなマンガが入ってくるというのも面白いと思います。日本のマンガが世界に出ていくことも、世界のマンガが日本で楽しまれることも、両面で増やしていきたい」(石渡氏)

文化としてのマンガの広がりによって、世界との距離が縮まっていく。

文・三ツ村崇志

  • Twitter
  • Facebook
  • LINE
  • LinkedIn
  • クリップボードにコピー
  • ×
  • …

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み