アドビが驚きの生成AI技術を披露。「写真の映り込み消す」「動画を多言語翻訳」など

Sneaks

Adobe Researchのメンバーが直接「未公開技術」をちょい見せする「Sneaks」が開催された。

撮影:小林優多郎

アドビは10月11日(現地時間)、アメリカ・ロサンゼルスで開催中のイベント「Adobe MAX 2023」で、開発中の新技術の一部を公開した。

MAXでは例年2日目の夕方に、研究部門・Adobe Researchチームの面々が開発中の技術を直接プレゼンする「Sneaks(スニークス)」が開催される。

Sneaksで公表された内容は、参加者やSNSの投稿などからフィードバックを得て、いくつかは実際の製品に実装されている。

さまざまなクリエイティブツールを展開するアドビは、クリエイターのどんな問題解決に取り組んでいるのか。その詳細を解説する。

映り込みの写真を撲滅するAI技術

Project See Through

左側が元の写真で、右側が処理後の写真。元の写真だと左上の部分に大きく映り込んで見えなくなっていた室内の机が、処理後の写真では見えるようになっている。

撮影:小林優多郎

MAX 2023のSneaksの中でも会場が最もざわつき、実用性が高いものは「Project See Through」だろう。

電車や飛行機、家などで風景を撮ろうとした時、大体の場合は自分や背景が窓に映り込んでしまい思ったような写真にならない。

Project See Throughはそんな映り込みをAIが一発で除去してしまうツールだ。

AIがどの部分が映り込みの画素なのかを識別しているため、ユーザーがやることはほとんどない。

デモでは、ほとんどの領域が映り込みになってしまっている窓越しに撮影した室内写真をツールに入れて、見事に違和感のない「室内の家具」や「被写体の頭の部分」を生成していた。

次世代Photoshopの原型になるようなツールは完成間近?

同じく静止画向けのAIツールが「Project Stardust」だ。

これは写真に写ったすべての被写体をAIが認識し、ユーザーは被写体を自由に好きな場所に動かせるというものだ。

Photoshopなどの画像編集ツールでも最近ではかんたんに写真ないの被写体を選べるようにはなったが、当然その被写体を動かすと、そこは何もない「下のレイヤー」もしくは「背景色」が出てしまうことになる。

Project Stardustはその部分を自動かつリアルタイムでAIが埋めてくれるため、好きな場所に被写体を動かせる体験が実現している。

Project Stardust

Project StardustではAdobe Fireflyの生成機能(テキストから画像生成)が使える。

撮影:小林優多郎

ちなみに、似たような体験のできるAI編集機能は、5月に開催された「Google I/O 2023」で「編集マジック」として発表されている。

グーグルの編集マジックも、アドビのProject Stardustも、一般公開された機能ではないため、その優劣はわからない。

ただ、Project Stardustの場合は、Adobe Fireflyの画像生成機能を統合しており、そこにはいなかった被写体を追加したり、服の色を変えたりすることも可能になっていた。

Project StardustのUI

Project Stardustは現時点ではWebアプリのようだが、アイコンやボタンなどかなり作り込まれているようだった。

撮影:小林優多郎

また、Project Stardust自体はSneaks前にSNSなどの公式アカウントで予告されていたが、これは歴代のSneaksの中でもなかなかないことだ。

すでにSneaksのデモでも、かなりしっかりとUI(ユーザーインターフェイス)が作り込まれていたため、「製品化」も近い機能なのではと期待が高まっている。

AIは動画製品でも本格化。4つの新技術が発表に

2023年のSneaksは生成AIが中心になったわけだが、その範囲は静止画だけではなく動画や音声領域まで拡大していた。

わかりやすいのは「Project Fast Fill」だ。

これはPhotoshopの「生成塗りつぶし」の動画版と言える機能で、動画に写っている被写体の一部を違和感なく消すことができる。

動画とはかんたんに言えば、静止画(コマ)を高速に連続で表示しているような仕組みになっている。だが、Project Fast Fillでは1コマずつ「消したい範囲」を指定する必要はない点が画期的なところだ。

また、会場ではシャツを着た男性が歩いている動画で、胸元を選択してネクタイを生成したり、カップに入ったラテを手で持って歩く動画でラテアートを変更するといったデモが披露されていた。

Project Fast Fill

写真左端が生成範囲を選択しているところ。右側の2つの写真がそれぞれネクタイの生成結果。

撮影:小林優多郎

ネクタイの例では男性の胸元に追尾しているのはもちろん、ネクタイにかかる影や光も違和感なく再現。ラテの例では、コップが揺れてラテの表面が揺れている様子に合わせて生成できていた。

そのほか、以下の技術が公開され、動画編集ソフト「Premiere Pro」や「After Effects」への搭載が期待されている。

Project Scene Change……被写体と背景の動画をそれぞれ読み込むと、奥行きや目線の高さ、カメラ軌道をAIが考慮して、自動で合成してくれる機能。

Project Dub Dub Dub……動画の音声を多言語に翻訳して吹き替えまでできる。デモでは日本語を喋っている女性の動画から、数秒でヘブライ語、アラビア語、英語、韓国語などのバージョンの動画が生成されていた。

Project Res Up……「低解像度の動画を2倍にアップする」という高解像度化技術。古い動画などに使って現代の再生環境でもみやすくできる。その実力は、SNSなどでみるような低解像度なGIF動画を見られるレベルの動画に変換できるほどだ。

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み