音声UIの本質的な力は、スマートスピーカーデバイス単体を大いに凌駕しています。

なぜ、声が拡張現実インターフェイスへと進化を遂げるのか?

あるいは、音声UIがなぜ主流になるのか?

--

音声UIはある意味AR技術の狙っている技術的方向性や生活シーンでの適合性のど真ん中の体験価値を提供するものなのだと思います。

でも、AR技術方向で考える際の間違ったバイアスが存在することで、その可能性が見えにくくなっているのだと思います。

拡張現実が視覚的表現の範囲で語られるのは、その限界を狭めていると思います。

AR技術は視覚表現に偏りすぎている。その弊害は思ったより大きい。

・ARはワンウィンドウ体験に限られていないか?

・ARは「目の体験」を中心にし過ぎていないか?

・ARはウェアラブルの文脈に偏り過ぎていないか?

・ARはスマホのタッチ体験の延長系に収まっていないか?

・ARはUIデザインのみの文脈で語られ過ぎていないか?

・ARが仮想と現実のミックス技術だとした場合のARクラウドの使い所がもっとあるのではないか?

・ARのマネタイズも含めて付加価値の提供部分が視覚化の視点に限定され過ぎていないか?

ARが本来持っている、現実世界のコンピューティングという価値の源泉がスマホ的UIの延長系や、ウェアラブル的な可視化装置としての体験性に余りに偏っているのではないか?

マジックリープに代表されるような視覚的スペクタクルは、AR技術のもたらす新しい体験性を訴求しやすいという側面があります。

声が優れていることは意外に見えづらい。

また一方、音声UIの持っている強みとしては、

・操作が非常に簡単で、デジタルディバイド的なクラスターの利用価値が提供できている。

・現実空間のデバイスと会話的なインターフェイスで繋がれるというポイントにおいて、既に現実と仮想を結びつけるという体験価値を提供できている。

・デジタルエージェントが質問への応答という形で既にディープラーニング技術の応用を行っており、クラウドAIの付加価値を届けられるシステムとしてある程度成功を収めている。

・アマゾンエコーに代表されるスマートスピーカーは、購買体験の刷新という部分で、既にエコシステムの構築に向け足が掛かっており、付加価値が経済的な循環を描ける絵面が見えている。

・スマホやヒアラブルなど、スマートスピーカーデバイス以外での応用もかなり進んでおり、デバイスフリーな体験性を今や創造しつつある。

・複数人の同時並行の対話を聞き取って識別できるという点ではデバイスと人との対応関係が自由であり、ワンデバイスワンヒューマンという従来的なマンマシーンの結合形式を刷新しつつある。

一方、音声UIは視覚化しづらく、一見地味に見えてしまいます。

視覚的なARが目立ってしまう弊害。

上記のようにスマホARやウェアラブルデバイスによるARではまだまだやれてないことが、音声UIでは広範的かつ汎用的かつ、デバイスやOSに縛られない(音声起点の)エコシステムの構築に向けた、様々な成功を収めつつあるのが、今眺望する限りでの音声UIのアドバンテージだと言えます。

AR技術はそういった意味では、理念やコンセプトの進展の割には音声UIがもたらしているような、現実的な付加価値や経済効果を生み出せていないと感じます。

拡張現実が視覚表現の範囲に収まらないということを認識すべきです。

でも、その原因は非常にシンプルで、

・スマホの延長として見えた方が付加価値を想像しやすい。
・視覚表現に紐付いている方がインパクトを感じやすい。
・上記理由によりエンターテイメントやゲーム、コンテンツなどの様々な領域での応用が想像しやすい。
・Sci-Fi的なかっこよさが演出しやすいので単純に盛り上がる。演出効果が高めやすい。

などの根拠・理由がありそうです。

音声UIは結果として、クラウドAIと非常に相性が良かったのです。

音声UIがAR技術のコアに躍り出る時

が、現実には音声AIを通じたディープラーニング技術の向上や、デジタルエージェントを通じたクラウドAIの鍛錬、購買体験刷新等によるエコシステムの構築など先行していることは明白で、その上、その成果が現実に目の当たりになればなるほど音声UIの未来がますます切り開かれていくことがイメージ可能です。

一方、その成果としてARアプリやARデバイスに対し、音声UIがより具体的で現実的な付加価値を提供していくことも当然の流れですし、それが今までどうしてもイメージ先行だったARインダストリーに対して、より直接的で付加価値の向上に向けリアリティある貢献をすることも自然にイメージできます。

スマートスピーカーデバイスがディスプレイを持ちつつある状況は、さらにその進化を遂げる予兆だと言えます。

ただ、こと日本に限ると日本語音声技術の難しさや、スマートスピーカー普及の遅れなどもあって上のようなコンテキストで音声UIをARプロダクツに紐付けていくイメージが持ちづらいと言えます。

要するにその戦場とする地域に応じリテラシーやコンテンツが偏ることにより、せっかくの巨大なイノベーションに気がつかないまま看過してしまうという事態が、また再び起ころうとしているのだと感じます。

クラウドコンピューティングでもスマートフォンでもIoTでも起こったことと同じ誤りが今再び引き起こされているのが現状のAR市場だと思います。

スピーカーに喋ることが当たり前になる世界観なんて、それこそ数年前迄は全く成立していなかったのですから、世界の変わって行く速度の変化に震撼する次第です。そして、今やその真価はスマートスピーカーデバイスを越えて広がりつつあることを意識するべきと考えます。

音声UIが視覚表現を伴った時に、新しいARのインターフェイスへと変化することでしょう。

--

--