アップル本社で展示されたVision Proの実機
撮影:西田宗千佳
今回のWWDCについて、やはり大きなトピックは「Apple Vision Pro」だ。
AR機器にしろVR機器にしろ、最大の課題は「体験しないとわからない」ことだ。スペックでもPVを見ても伝わらない。
筆者は米・クパティーノにあるアップル本社で、Vision Proの実機を体験できた。その様子をお伝えしたい。
仕事柄色々なIT機器を使うし、その中には業務用の特別なVR/MR機器もある。ただVision Proは、それらを超えて、近年なかったほど「驚き」としか表現できない体験だった。実機で感じたことを言語化してみたい。
なお、体験時には写真撮影などが許可されなかったため、実機は別の場所で撮影したものであり、その他は基調講演で公開された映像から抜粋している。
1. 現実の世界とCGの世界が地続きに
撮影:西田宗千佳
最大の驚きは「自然さ」だ。
近年、カメラを搭載し、外の映像を取り込んでCGと合成する「ビデオシースルー」形式のヘッドマウントディスプレイ(HMD)機器は増えてきた。
ただ、過去に体験したそれらのHMD機器とは見え方が全く異なる。視野角(FoV)を除けば、現実と大差ないように見えるのだ。
「目」と「カメラ」は画角も機能も違う。だから単純にビデオシースルーを実現しても、現実からは乖離が出やすい。立体感がおかしかったり、画面の一部が歪んだりすることもある。
特に、今あるコンシューマ向けのHMD機器では、性能の限界から解像感・発色に違和感が出やすい。
それが、Vision Proは全く違った。
「自分が本当に見ているのは目の前の部屋の映像である」ことを忘れてしまうくらいだ。部屋の中を歩き回っても、ズレが原因で転んだり気持ち悪くなったり……ということはない。
基調講演ビデオより。実景の中にCGで平面のウインドウが開いている。
出典:アップル
写真は合成イメージなのだが、実際、こんな風に自然に見える。
出典:アップル
実物の本やスマホの画面も読める。ただ、解像度は現実ほどではないので、確認程度だと思った方がいいが。
ちょっと想像してみてほしい。
今、目の前の空間に、ウェブブラウザーやメッセージアプリが浮かんでいたとしたら?
ウィンドウの中には半透明で、向こうに見えるものがほんのり透けて見えるものも。
出典:アップル
日常の風景を「立体撮影した写真」が置かれていたとしたら?
立体撮影された子供の写真だとまるで「本当にそこにいる」ような生々しさを感じた。
出典:アップル
映画『アバター』の3D版が、まるで奥行きのある巨大な箱のようなスクリーンの中で再生されていたとしたら?
映画を大きな画面で楽しむのはHMDの得意技だが、品質の高さと「3D映像」が大きな特徴。
出典:アップル
そのイメージは、「今皆さんがみている風景の一部が、ディスプレイや3Dオブジェクトになったとしたら」という感じだ。
実体験としては、まさにアップルのデモビデオにあるとおりの風景であり、過去、多くのAR関連機器のプロモーションビデオで「イメージ」として描かれてきたものそのものだ。
現実とコンピュータの世界を地続きにする試みは、多くの企業がチャレンジし続けている。
アップルはついに、その世界をイメージではなく現実のものとした。
これは画期的なことだ。
専門的なことを言うと、視野角(FoV)は約90度で、残念ながら、完全に視野全部を覆ってしまうほどではない。だがそれでも視野の大半を覆ってしまうことに違いはなく、Vision Proの外に広がる世界との違和感は小さくなっている。
2. 周囲とのコミュニケーションを重視
出典:アップル
Vision Proは「周囲とのコミュニケーション」にかなり力を入れている。
それがよくわかったのが、「Persona(ペルソナ)」と「EyeSight(アイサイト)」という機能のデモだ。
Vision Proでは、距離センサーを活かして自分の顔を「スキャン」して、自分に似せた「Persona」を作れる。
PersonaはVision Proの視線認識などと連動して、目の動きや表情、口の動きや身振り手振りなどをそのまま再現する。
「Persona」機能。自分の姿を機械学習で3D化して、ビデオ通話などでアバターとして使う。
出典:アップル
他のHMDではいわゆる「アバター」で同じことができるが、Vision Proはあくまでリアル志向だ。Personaは「Vision Proを外すことなくコミュニケーションする」ためのものでもある。
例えば、FaceTimeやZoomのようなビデオ会議・ビデオ通話は、HMDをつけたまま「自分の顔を見せて通話するのが難しい」部分もあった。
だがVision Proの場合、Personaの「自分の姿」を通話で使うことで、HMDをつけたまま自然な対話ができる。Vision Pro同士だけでなく、普通のiPhoneやPCと通話する場合、Personaが話しているように見えるわけだ。
「EyeSight」もまた、他者との関係を重視した機能だ。EyeSightは、誰かが近くに来て話しかけてきたら、その人を認識して、その部分だけ「相手を画面内で見える」ようにするもの。Vision Proをかけたままでも問題なくコミュニケーションができた。
近くに来た人とコミュニケーションを取るための「EyeSight」。自然にその場所にいる人だけが見える。
出典:アップル
HMDでもヘッドホンでも、つけていると「話しかけてほしくない」印象ができる。だが、EyeSightによって、周りにいる人に話しかけられても自然に対応ができる。
3. 重量は450g程度、つけやすさ・見易さに配慮
Vision Proの側面。ヘッドバンドや、目の周囲を遮光するカバーは取り外すことができる。
出典:アップル
肝心の装着感はどうだろうか。
正確な重量は開示されていないが、アップルによれば、重さは「1ポンド程度(約453g)」だという。市場にあるVR用ヘッドセットの中では軽めだ。ただし、市場には100g台から300g台の製品も出てこようとしているので、「圧倒的な軽さ」ではない。
装着すると、頭頂部を止めるバンド(写真にはない)と、後頭部を止めるクッションの両方で位置合わせをし、額と頬骨あたりで「パッド」を使って重量を支えるような感覚になる。重心が前側にある「フロントヘビー」状態ではある。
ただ、後頭部を止めるクッション部や、顔に当たるパッドは柔らかく、感触が良かった。
今回は、フィッティングのために「顔の形状認識」と、「視力補正レンズの調整」も試せた。前者は、iPhoneのFace IDで行うような作業で、後者は自分がかけているメガネを計測し、補正内容にあったレンズを探す作業だったようだ。この2つは、さほど時間はかからない。
最初のセッティングでは、目の間の距離(瞳孔間距離、IPDという)と視線追尾の調整をする。
こちらも実に簡単。(ゴーグルの右上にある、Apple Watchのリュウズのような)デジタルクラウンを長押しするだけだ。
Vision Proのデジタルクラウン。
出典:アップル
するとIPDが自動的に計測され、調整が完了する。多くのデバイスでは、自分でレンズの幅を動かして調整する場合がほとんどだが、メカニカルにVision Pro側がやってくれる。
視線追尾は、目で点を追っていって調整する。こちらも数十秒もあれば終了だ。
ディスプレイとして内蔵する「マイクロOLED」(マイクロ有機EL)のような小さな表示デバイスを使う場合、視野角を広げようとすると、視野中央の部分が狭くなる傾向にある。前述のように、視野角が90度前後と狭めなのはそのためだろう。
だが、IPDを正確に調整することで、この不利はある程度カバーしやすくはなる。
また、視線追尾を生かして中心視野を把握することで、映像の描画については「感覚が鋭い中央」は細かく描き、周囲は描画量を抑えて処理を軽減する「フォービエーテッド・レンダリング」という技術も使える。解像感・快適さの演出にはこれも効いていそうだ。
電源はケーブルにつながったバッテリーを使うが、動作時間は2時間。
Vision Proの電源部分。左側面から、取り外し可能なケーブルにバッテリーをぶら下げる方式。
出典:アップル
実はバッテリーにUSB Type-Cの端子があり、そこに別途ケーブル+ACアダプターをつなげば、もっと長い時間使える。
ちなみに、付属バッテリーは容量の大きなものだが、「航空機内に持ち込めるサイズと容量」(アップル)が選択されているという。
5. 専用アプリで広がる「ARワールド」
Vision Proでは、iOSやiPadOSのアプリがそのまま動く。
OSのフレームワークが同じであるからだ。すなわち、仕事用にしろゲームなどにしろ、日々使っているアプリはそのまま生活空間の中でも使える、ということだ。
Vision ProのOS構造。iOSが元になっている。
出典:アップル
もちろん、Vision Pro専用のアプリを作ることもできる。
基調講演では、「Microsoft OfficeやZoomなどが使える」とアナウンスされたが、それらはVision Pro専用に、さらに操作や表示を最適化したものだという。アップルによれば、それらの企業とは連携し、先行して開発を進めているとのことだ。
Microsoft Officeもフルバージョンが用意される。
出典:アップル
前述のPersona対応も含め、これらのビデオ通話サービスを提供する企業とはすでに提携済み。
出典:アップル
もちろん、3Dをうまく活かした「まったく新しい体験」もある。
例えば今回は、恐竜が3Dで空間に再現されるアプリも体験できた。
部屋の空中に、大きな窓のように「恐竜の世界」が見えてきて、恐竜に触れられるくらいまで近づける。まじまじと見つめても、荒さのない、非常にリアルな恐竜が実際に「そこにいる」感じだ。
Vision Pro専用に「いかにもARらしい」3Dアプリケーションも作れる。
出典:アップル
触ろうと手を伸ばすと、手の向こうがちゃんと「隠れる」のに気づく。
現実世界なら当たり前のことだが、CGの世界ではそうではない。手の位置を把握し、その向こうにある恐竜などとの位置関係を把握し、それらを矛盾なく扱えないと、このような表現は難しい。
いわゆる「オクルージョン(遮蔽)」と呼ばれる空間認識の技術だが、Vision Proが内蔵する距離センサーなどを使って、こうした自然さが実現できるのだ。
CGの位置合わせも安定していた。
蝶が飛んできて人差し指にとまる、というシーンもあるが、自分の指先にピッタリと止まり、色々な角度から見てもほとんど位置がズレない。じっと見つめると蝶の足まで見える。
そういうことが、本当に普通に「目の前の空間で、自然な形で繰り広げられる」ことこそがVision Proの凄みだ。
多くの人が思い描いてきたAR(拡張現実)的な未来を、目の前の現実として「1つの基準」を打ち立てたことが大きな変化だ。