さまざまなクリエイティブ製品を提供するアドビ。既に同社製品にはAI技術が多用されている。
撮影:小林優多郎
今やクリエイティブの現場とAI技術は切っても切り離せない関係だ。
MidjourneyやStableDiffusionなど、言葉を書くだけで絵を生成できるAIサービスが8月ごろに登場して以降、「画像生成AI」をめぐっては、クリエイティブ業界の内外で、技術的な注目と、活発な議論が続いている。
プロ/アマを問わずクリエイター目線の注目は、「高品質な絵の描けるAI」は、クリエイターにとってどんな存在になるのか、ということだ。
この命題に対し、Photoshopに代表されるツールを開発しているAdobe(アドビ)はどう解釈しているのか。
10月18日〜20日にアメリカ・ロサンゼルスで開催された「Adobe MAX 2022」での、役員へのインタビューやアップデートの内容から、アドビのAIに対する一つの考えを解説しよう。
「AIは副操縦士だ」ジェネレーティブAIへの3つの方針
Adobe MAX 2022に登壇したシャンタヌ・ナラヤン会長兼CEO。
撮影:小林優多郎
10月18日、米ロサンゼルスで開かれたAdobe MAX 2022の基調講演に登壇したアドビのShantanu Narayen(シャンタヌ・ナラヤン)会長兼CEOは、「人工知能と機械学習は、人間の創意工夫の力を大きく広げていく」と述べ、「AIは副操縦士(CoPilot)としてあらゆるクリエイティブをサポートする」と表明した。
その具体例としては、既に提供されている動画編集アプリ「Premiere Pro」の音声テキスト変換機能や、今回のMAXでも機能強化が発表された「Photoshop」のコンテンツに応じた塗りつぶし機能などを挙げた。
いずれの機能もMidjourneyやStableDiffusionなどの「ジェネレーティブAI(生成するAI)」とはやや方向性が違う。
一見、これはジェネレーティブAIに対する否定の姿勢にも見えるが、アドビの答えは決してそうではない。
AI技術に関するスタンスを表明する、アドビのデジタルメディア事業部門担当エグゼクティブバイスプレジデント兼CBOのデイビッド・ワドワーニ氏。
撮影:小林優多郎
前述の基調講演に登壇したアドビのデジタルメディア事業部門幹部のDavid Wadhwani(デイビッド・ワドワーニ)氏は、PhotoshopなどにジェネレーティブAIとその技術について以下の3点に主張をしていた。
- AIは「人間の創造性を高めるもの」であり、取って代わるものはない
- ジェネレーティブテクノロジーには、今後も開発や投資を続けていく。クリエイティブワークフローの中で動かしていく
- ジェネレーティブテクノロジーの業界標準をつくっていく。「倫理とデジタル証明」に関する標準を開発する
アドビは同社のAI技術などを「Adobe Sensei」と呼んでいる。
撮影:小林優多郎
アドビは元々、AIや機械学習によるクリエイティブ技術を「Adobe Sensei」と称してきた。
Sensei=教師としての「先生」より、日本語的には「師範/師匠」といった意味あいが強い。クリエイターを成功に導いていく存在を示している。
この方針は、ジェネレーティブAIについても、Senseiと地続きと考えてよさそうだ。
「BetaのBeta」で公開されたアドビのジェネレーティブAI
MAX 2022に合わせてベータ版Photoshopに追加された「背景クリエーター(Beta)」。
画像編集:小林優多郎
その考えの片鱗は既に一般ユーザーが試せる機能として公開されている。それが「背景クリエーター(Beta)」だ。
背景クリエイター(英語名:Backdrop)は、Adobe MAX 2022に合わせて公開された「Photoshop (Beta)」(バージョン24.1.0)に、ニューラルフィルターの1つとして搭載されている。
Photoshop本体と機能名それぞれにベータ版と示されている通り、背景クリエイターは未だ「継続して開発中というステータス」(アドビ広報)の機能になる。
つまり、背景クリエイターは製品版になる時期も未定で、実際の機能も現時点のものとは大幅に異なるものになる可能性がある、という位置づけだ。
生成したい背景を表す言葉を入力する。
画像:筆者によるスクリーンショット
実際にインストールしてみるとその操作感は、前述のMidjourneyやStableDiffusionに近い。背景として使いたい画像のイメージを言葉にして入力する。
筆者の手元の環境では、英語でも日本語でも画像は出力された。出力された画像を選び「OK」ボタンを押すと、見慣れたPhotoshopに新規レイヤーとしてAIが作成した画像がインポートされる。
作品を構成する「背景」というパーツをつくる感覚だった。
画像編集:小林優多郎
ただ、具体的な単語を用いても、主題のわかりづらい画像が出力される印象だった。
扱いに少しテクニックがいるのかもしれないが、機能名の通り、あくまでも作品の「背景」を生成する機能だからなのかもしれない。
なお、学習データはアドビのフォトストックサービス「Adobe Stock」に投稿・販売されているものを活用しているという。またアドビ広報によると、写実的な画像だけではなくイラスト風の画像を生成することもできるという。
作品をクリエイターと一緒につくるAI
18日の基調講演では、ワドワーニ氏がPhotoshopの範囲選択とプロンプトベースのジェネレーティブAIを組み合わせた際の、Photoshopのワークフローのイメージを示していた。
出典:アドビ
Photoshopなどを統括するデジタルイメージングオーガナイゼーション担当VPのMaria Yap(マリア・ヤップ)氏は、この背景クリエイターや、基調講演でワドワーニ氏が示したイメージ映像について「Photoshopのワークフローでどう使っていくのか示している」としている。
「例えば、お城を自分の画像の中に合成したい場合、選択範囲を与えてから『中世のお城をつくりたい』と入力します。
シンデレラ城でも砂の城でも、さまざまな言葉を用いて、完全にユニークなピクセルを生成できます。
また、選択範囲を示すことによって、生成される画像はその範囲の中に収まり、また背景にあったものになります」(ヤップ氏)
アドビのデジタルイメージングオーガナイゼーション担当VPのMaria Yap(マリア・ヤップ)氏。
撮影:小林優多郎
ヤップ氏は全体の作品の一部として、クリエイターの意図に沿ってAIが元の画像になかったものをつくることを「私たちのツールでジェネレーティブAIを使う方法」としている。
また、プロンプトベース(文字を入力して操作すること)ではないが、既に提供している機能も「ジェネレーティブAI」である、としている。
筆者がスマホで撮影したMAX 2022会場の写真に「風景ミキサー」を適用して数十秒で制作したもの。当然だが、会場のLos Angeles Convention Center周辺はこのような草木が生い茂っているわけではない。
撮影・編集:小林優多郎
それは、ニューラルフィルターの一種である「空を置き換え」(画像内の空を別の青空や夕暮れに置き換える)や、「風景ミキサー」(風景写真を廃墟風や雪景色などに書き換える)などになる。
従来の画像編集、すなわち画像処理とは、突き詰めれば計算結果だ。元の画像から数式や一定のアルゴリズムによって導き出された結果を表示している。
一方で、空を置き換えや風景ミキサーは、演算はしているもののAIが出力したものであり、その本質は異なると言える。
(後編「Adobeの考えるAI時代に必要な『認証』の仕組み」に続く)
(文、撮影・小林優多郎、取材協力・アドビ)