Pocket

ゲスト執筆者のカイル・サマニはビデオによるフィールドサービスソリューションを提供しているPristineの共同設立者にしてCEOだ。

拡張現実(AR)と仮想現実(VR)は技術業界におけるホットな単語になっている。大企業達はこれに賭けており、また投資家達もこれに資金を注ぎ込んでいる。

フェイスブックはOculusを20億ドルもの巨額で2014年に買収した。グーグルはGoogle Glassを2012年初頭にお披露目した後も、周囲の予想に反して投資を続けている。マイクロソフト、ソニー、東芝、サムスンも自社のスマートグラスを発表している。シリコンバレーのメジャーなベンチャーキャピタルのほとんどすべてがMagic Leapに興味を示しており、Atheer、Meta、Optinvent、Recon、Vuzix、Epson、ODG等のスタートアップ企業のホストをしている企業もスマートグラスを作っている。この分野はまさに火が付いている状態だ。

しかしARとVRは何が違うのだろうか? 辞書サイト:Marriam-Websterでの定義によれば、

[AR] 技術の利用により拡充された現実の事。(スマートフォンのカメラなどのように)デジタル情報を加味するデバイスを通して現実世界を見ることにより実現される。

[VR] コンピュータで作られた音声及び映像で構築される仮想世界。その世界を経験する人の行動による影響を受ける。

この事からOculusはVR技術でありARではないことは明らかだろう。同じく先ほどリストアップしたものの内、Oculus以外はVRで無いことも明らかだが、しかしこれらはARなのだろうか?

多くのメーカーやメディアは、先程の例のことをARだといっている。が、実の所そうではない。

こんなものはARではない

辞書の定義と私の見解で異なるのは次のことだ。私は本当のAR技術はユーザーが見ている現実世界のイメージに映像を重ねあわせるものだと考えている。そして候補に上げられたデバイスの多くは現実世界の映像とビジュアルオブジェクトが有意義な形で重ね合わさるようにできていない。

むしろこれらのデバイスは単にテキストやデータを手を使わずに読めるように表示しているだけに過ぎない。これらはヘッドアップディスプレイであり、ARデバイスとは言わない。例えば以下のような例だ。

MTMyMDgwNTU0OTU3OTI2Mzcw
MTMyMDgwNTU0OTU3OTkxOTA2

私にとってこれらのイメージはARとはどういうものかを表すものではない。なぜ心拍数を視界に表示しておく必要があるのだろう? ランニングやサイクリングの際にすぐ見れることが重要だからだろうか? データがぱっと見れることは便利だからだろうか? なぜ温度のアラートが視界のど真ん中に無ければならないのか? 別に右の隅にでも表示されていればいいのではないか?

この様なエクスペリエンスはARではない。私自身よく茶化してこういうのだが、携帯を顔面に貼り付けているようなものだ。洗練されているとは程遠い、それが私が言いたいポイントだ。

より優れたARの定義を目指して

ではより優れたARの定義とはどのようなものだろう? ARはスクリーンに情報を移すことだけでなく、現実世界の映像の上に、情報を賢い方法で重ねあわせるものであるべきだ。

MTMyMDgwNTU0OTU3OTE2MTcw

これはAtheerによる正しいARの一例だ。データのレイヤーが空間的に有意義な形で物理オブジェクトの上に重ね合わさっている。青の矢印などはその位置を正確に表示される必要がある。もし10フィート右に動いた後に同じパイプの部分を見れば、新しい立ち位置/視点に基づいて矢印とデータは更新されなければならない。でなければこれらの情報は全て正しくないことになる。

しかしデータを視界周辺に箇条書きで表示してはどうか? わざわざ物理オブジェクトの上に表示する必要があるのだろうか? これは必要とする情報のタイプやユースケースによっては重要な問い掛けだ。

上記の圧力計の場合を例に取ると、物理オブジェクトのすぐ上に情報を重ねて表示するのは見た目はいいかも知れないが必要なことではない。代わりに視界の周辺に次のようにテキスト表示されても良い。

  • Motor 1: 65C
  • Motor 2: 27C
  • Motor 3: 2.4 bar

片やフローを表す矢印は視覚的にコンテキストを表すものだ。絵的なもの無しで液体の流れを表現する事はここのオペレーターにとってあまりにも無意味なことだろう。やって出来ないことはないだろうが、流れをビジュアルでなく記述で表現する事は良い方法ではない。

別の例を挙げよう。Atheerからの画像だ。

MTMyMDgwNTU0OTU3OTA0MzUw

この例では、テキストを視界の周辺に配するのは適切ではない。絵的なコンテキスト無しに、Location 16-38-30についてどうやって説明できるだろうか?ビジュアルコンテキストを伴ったテキスト配置は、この一例においては必要不可欠なものだ。

本当のARというものは、いわゆる携帯を顔面に貼り付けるのと比べて桁違いに複雑なものだ。なぜだろう?それは本当のARは精密かつエレガントな光学技術(まだそんなものは出てきてないが)や、視線追跡(製品化されたハードに実装されたことはない)、高度な画像認識技術の上に成り立つからだ。この事でよりパワフルなプロセッサが必要となり、そうなるとより高度な排熱と容量の大きなバッテリーが必要となる。実用レベルの洗練されたARが商業ベースに乗るのはまだ数年も先のことだ。

心拍の表示、超音波映像、パイプラインの稼働状況など特にスマートなやり方は必要とされない。ちょっとしたデザインのやり直しで十分だろう。

なぜこれらの事が重要なのだろう? 我々は今、視覚デバイスのあらゆるレベルで驚くべきイノベーションを目撃しているところだ。大企業やスタートアップも考えられる限りのビジネスのアプリケーションを開拓している。

彼らの多くは顔面に貼り付いた携帯の域から抜け切れていないが、それはそれでいいだろう。アプリケーションを作るチームや、その企業を買収する人たちは彼らが直面しているユーザーエクスペリエンスの壁を理解し、適切にデザインする事を分かっていれば良い。

また、スマートグラスの分野は初期段階とすら言えない状況だと言うことも言える。今日のスマートグラスアプリの成熟度は、2000年当時のスマートフォンアプリのようなものだ。その頃はまだiPhoneの時代ではなかった。

スマートグラスアプリに携わる企業の第一陣が作ったアプリは、携帯を顔に貼り付けた位のものであり、容易に達成できるものだ。まだまだ掘り出されるのを待っている大きな価値は眠っている。

画像提供:
トップ画像提供:Microsoft
その他画像提供:Pristine and Atheer

Pocket