写真に歌わせるAIアプリが人気…誰でも面白動画が作成できる。著作権や肖像権の問題も

ウォンボ・エーアイ

写真に「チャグ・ジャグ・ウィズ・ユー(Chug Jug With You)」を歌わせることがことができる。

Twitter

  • スマホアプリのWomboを使うと画像の顔に歌わせることができる。
  • WomboのCEO、ベンザイオン・ベンキンは、ウェブサイト制作から人工知能による顔の制作に転向した。
  • アプリは2週間前に公開され、すでに200万回以上ダウンロードされている。

この2週間で、Womboというスマホアプリがソーシャル・メディアで広まり、金正恩(Kim Jong-Un)モナリザ(Mona Lisa)といった人物の画像が口を動かして歌うディープフェイク動画が作られている。人工知能(AI)を使って写真を歌う動画に変換するこのアプリは、iOSのApp StoreとGoogle Play ストアで220万回以上ダウンロードされ、1500万本の「Wombo動画」が作られている。

「カメラの前で歌ったり、面白いこと、エンターテインメント性の高いパフォーマンスをする人がいるが、AIを使えば誰にでもできるようになる」と、WomboのCEO、ベンザイオン・ベンキン(Ben-Zion Benkhin)はInsiderに語った。

「Womboがやろうとしているのは、誰もが簡単に、面白くて、シェアされそうな、エンターテインメント性の高いコンテンツを作ることができるようにすることだ」

ベンキンは過去5年、トロントでウェブサイト制作会社を経営しており、その後、アプリ開発に挑戦。AI技術に対する興味と関心からWomboのアイデアを思いついたのは2020年8月のことだった。わずか7人のスタッフで1月にベータ版を公開し、おかしな動画が人気になって軌道に乗った。

Womboの仕組み

用意された楽曲それぞれに、開発者がモーション・キャプチャーを使って製作した動画がある。あらかじめモデルが歌に合わせ顔、目、口を動かして作られたデータがユーザーの選ぶ画像に紐付けられる。ベンキンが「技術的にきちんと解説すること」はできないとする「複雑な数学」を使い、アプリは画像を処理し、かわいい動画や、呪われたような傑作を生み出す。

このアプリは任意の画像を使うことができる。人気の投稿の多くは、著作権や肖像権の存在する人物を使用している。現時点で、権利保有者が問題視するようなことは起きていないが、ベンキンは「今後どうなるかは分からない」と述べた。

現在アプリで使用できる楽曲は、リック・アストリー(Rick Astley)の「ギブ・ユー・アップ(Never Gonna Give You Up)」や「恋のマイアヒ(Numa Numa)」といった15曲だ。ベンキンによると、著作権問題については現在取り組んでいて、「数人のアーティストとは合意済み」だという。今後は、ミュージシャン側が楽曲を採用してほしいと思ってくれることをベンキンは期待している。

「ユーザーとバイラルに、楽しく関わることができるまったく新しい方法だからだ」

Womboは安全か

アプリのプライバシー・ポリシーによると、「顔の特徴のデータ」はアプリ内のみに保存され、動画が作られた後は「速やかに消去される」。データは、アマゾン・ウェブ・サービス(AWS)へと送られ、「写真アニメーション機能」と「行動分析プラットフォーム」の「プロダクト・インテリジェンス」に利用されるという。

無料版では広告が表示されるが、月額4.49ドル(約500円)または年額29.99ドル(約3300円)と有料プレミアム版では、データ処理が速く、広告が表示されない。将来的には、ミュージシャンや広告主とコラボレーションできることを期待しているという。

WomboはAIを使ってディープフェイク動画を作る。ディープフェイクの技術はここ数年で劇的に発展しており、限られた機能ではあるが、一般の人でもアクセスしやすくなっている。家系図サービスのマイヘリテージ(MyHeritage)は、亡くなった親族のアニメーションを作るツール「Deep Nostalgia」をリリース、あるビジュアルアーティストがトム・クルーズ(Tom Cruise)のニセ動画を作って話題になった。

「こうしたディープフェイクはすぐにはなくならない」とベンキンは指摘。「長い期間をかけ、人々が受け入れていくことになるだろう。我々はこのテクノロジーの応用範囲を探り始めたばかりだ」

ディープフェイクは、偽物だと知らずに見た人が、本物だと思いこむ危険性がある。ベンキンによると、Womboは2つの方法でこの問題を回避しているという。1つ目は「本物っぽいが、本物には見えない」画像を作ること。2つ目は、限られた曲を使っていて、最悪でも誰かにそれを歌わせることしかできないことだ。

Womboの将来は、話題になったこの勢いを生かし、ギミックや流行からインターネット・ユーザーが継続的に使用するものへと発展できるかどうかにかかっている。このアプリには、ユーザーが自分の顔を友人と共有し、それを動画にするというソーシャルメディア的なプランもある。

「新しい音楽の楽しみ方と出会える場所になるだろう」と、ベンキンは述べた。

「声を上げて笑いたいとき、笑顔になりたいときに使うアプリになればいい」

[原文:Wombo.ai lets users make silly deepfake videos of their friends or celebrities singing songs

(翻訳:Ito Yasuko、編集:Toshihiko Inoue)

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み