2017年のプレイボールを振り返る。

まさか、そんな解決法があったのか?それが、専門家達の口を揃えて言うセリフだろう...。

takahito iguchi
15 min readApr 17, 2017

2017年の時点ではスマートフォンが全盛だった。

クラウド化された人工知能(デジタルエージェントは当時スマートフォンのキー機能の一つだった)やIoT(あらゆるデバイスがインターネットに繋がる。つまりクラウド化される!)の流行、そして空を飛び交うドローンや自動運転によるEV、そしてロボット…。

スマートフォンのタッチインターフェイスが当時の操作系の主流だった。

俯瞰的には、そういったテクノロジー達が、この世界を席巻していた。

人とマシーンが、情報を通じて自由自在に語り合える世界だ。だが、その世界観の中心にあったのは、かつて世界中を支配していたグラフィカルなユーザーインターフェイスのままだった。

つまりスクリーンをポインティングし、アイコンやメニューを選択する方法が(マッキントッシュ誕生が1984年だから、33年も続いたことになる)相変わらず主流を占めていた。

もちろん、iPhoneのマルチタッチは素晴らしいが、Macのユーザーインターフェイスと基本概念としては、同じだと言える。

インターネットに接続するデバイスはものすごい勢いで増大した。

だが、人が画面を対話的に操作するような、ユーザーインターフェイスには限界がある。

言うまでもなく、IoTに代表されるデバイスの爆発的発展と多種多様なセンサーデータの巨大量。そしてクラウド化された人工知能のプロセッシングは瞬間瞬間に、新たなノーティフィケーションや画面上のサインを大量にもたらさざるを得ないのだ。

スマートフォンが幾ら便利になっても、その通知の嵐は、なかなか捌ききれない。

そう言った情報爆発の推移はかつてグーグルがウェブの大爆発に直面していた当時とは、まさにその数字の桁が違っていた。

それは数百倍ではなく数万倍のオーダーで異なる桁違いの情報爆発の事態だった。

インターネットを流れるデータの総量の増大は、マシーンとの対話においても顕著だった。

そう言った新しい時代に「検索窓にキーワードを入れてサーチする」など、それこそ雲霞の大群を虫取り網で押さえ込もうとするようなもの。

それでは、まるで追い付きようがない!画面と向き合ってする情報操作の限界は画面サイズや画面の数の限界と果たして同義なのか?

さてじゃあ、どうするのか?と、いうときの解決方法。きっとミレニアム前ならこんな感じだった筈だ。つまり、ウォールームの超大量のディスプレイとの対話のイメージになるだろう。

作戦司令部というと、ミレニアム以前はこういう雰囲気だった。

それがiPhone以降になると、きっとこんな感じになる筈だ...。

マウスやキーボードが、タッチやジェスチャーに変わるに違いない。よりモダンな印象である。

ジェスチャーやAR/VRのインターフェイスも基本的なアイデアは変わらず、注視と指し示し=選択だ。

が、気をつけないとならないのは、いずれにしろ画面とその指し示し(=ポインティング)による対話関係であるという点。

そういった意味では、それらはまるで(パラダイム的には)変わらないという事なのだ。

要するにシンギュラリティ時代(情報の超新星爆発)のインターフェイスとしては、まるで機能しないと言わざるを得ない。

画面サイズやタッチポイントがいくら増えても、それを処理する側はいちいちそこに注意を振り分け、情報処理するコストが膨大化するだけなので何ら課題解決になってないことが当時の大きな問題だった。

そんな中、ドキドキというサンフランシスコのスタートアップが発明し、当時(重ねて強調すると、スマートフォン全盛期の最中に)世の中に恐る恐る届けたのは、実に意外な解決法だった。

これがコンピューティングのスタイルだと言えるのが、2017年以降の大きな変革だった。

それは、ただソファで寝そべってリラックスし、ただ流し聞き、たまに喋りかけるだけという情報処理プロセスだった。

後世の批評家は ambient audible とか interaction without intention とか no focus and no stress computing とか、様々な言い方でそのスタイルを評することになるのだけども、その当時はまさかそれがコンピューティングそのものの大きな転換点になるなど、誰一人として予想ができなかった。

そう、そこには巨大ディスプレイもなければ、マウスやキーボード、あるいはタッチインターフェイスなどは存在しない。

画面を睨んで情報を理解して判断して、その上で画面を操作する。それが当時のユーザーインターフェイスの基本的な考え方だった。

どこにコンピューターがあるの?という利用スタイルが、2017年当時にようやく始まった。

ところが、ボール誕生期にようやく始まった音声コンピューティングでは、単に、聞き流しながら、時々喋りかけられる。マイクとスピーカーが内蔵されてネットワーク化された目立たないデバイス(当時はアマゾン・エコーが主流でとてもよく売れていた)だった。

そして、それらがインテリアを邪魔しないように控えめに置かれているだけだった。

それは、まるで音楽を楽しむようなスタイルだ。

当初のアマゾンエコーが音楽サービスから市場に入って行ったのが、まさにその予兆だったと言えるのかも知れない。

つまり、音楽を選曲するプロセスが「声=音でなされる」ことには合理性だけでなく、操作の一貫性や、一体感の面での効果も大きかったのだ。

アマゾンエコーの最初のキラーアプリは「音楽」だった。

例えば「Stingらしい音楽かけて」と言うだけで、それらしい音楽が流れてくる環境に、人は居心地の良さだけでなく、極めて効率的な情報処理の糸口を見出した。その発見は当のアマゾンと創業者のジェフベゾスでさえ驚きに満ちたものだった。

そして、ドキドキが当時ローンチした「ボール」という名称のソーシャルサービスはまさに「声」によって「声のソーシャル」を操作しようという単純なアイデアから始まった。

その「ボール」が街の雑踏やカフェの喧騒などをそのままクラウド環境に持ってきてことで、リビングルームの生活空間に人々の声を(まるで声の情報のシャワーのように!)配信し始めた。それが2017年のことだった。

2017年初頭のアマゾンエコーの販売数量が500万台だから、大きな節目に差し掛かったタイミングだった(目から耳への変化の時代とも言える)。

「ボール」はスマートフォンよりもアマゾンエコーの上でこそ生き生き動くアプリだった。

その情景を改めて考えると、本来人間的な情報交換の場として意図された、ソーシャルメディアのそもそもあるべき姿を実現したものだったとも(今なら)言えるだろう。

声は人と人が混じわる上で最も強力で、最も歴史あるメディアだった。

人が行き交い、語り合う。その空気感をリビングスペースに、さり気無くもたらしたこと。

それが、その時「ボール」の成し遂げたことだった。

単にリラックスした状態で、声を聞くだけ。あるいは声をかけるだけ。

しかも、緊張感がないどころか、対話的な(デジタルエージェントと会話するような)インタラクションでもなく、時々つぶやくような発話程度で、それこそ自宅やオフィスがウォールーム化しそうな勢いの情報の大爆発に対処することは果たしてできるのだろうか?

これは当然の疑問とも言える。

ただ、聞き流すだけ、それで時々絡むだけ、それで情報処理できるのか?

結論から言えば、それで良かったのだ。

無意識な状態で、なおかつ創造的な状態、いわゆるフロー状態での生産性の高さはもっと強調されても良いだろう。

つまり、リラックス状態で居られることは生産性の面でも効果的だったのだ。

また、それこそ音楽の視聴体験を例にとれば、かつては音楽=コンサートホールの椅子やオーディオセット手前に鎮座して、しっかり対面し、意識を集中してじっくり楽しむものだった(今、我々が Sportify を聴く際のスタイルとは全く異なっている!)。

劇場や映画、そしてテレビもそうだろう。テレビ番組をしっかり正座して楽しむような状況は、今となっては全く想像できないのだ。

音楽を聴くというスタイルがそのままコンピューティングのパラダイムになるとは!

YouTube や Netflix は常に流れているものだ。それこそ Sportify や Amazon Music のようでもあるのだが。「音楽を聴くように味わう」ように人との対話や様々な経験、または空間共有をストリームして楽しめるソーシャルメディアとして、今は人々の生活に定着している。

それは「聞き流し」とも言えるし、映像や音楽のメディアの流しっぱなしのスタイルは当時の最新トレンドだった。

であればソーシャルメディアやデジタル・コミュニケーションもその様で良いはずだ!

これが「ボール」開発時におけるドキドキの決断であり将来への大きな賭けでもあったと言えるだろう。

そういえば、パーソナルコンピュータもその当初デスクに鎮座し、畏まって粛々とオペレーションするものだった(もはや、想像すらできない!)。

それがスマートフォンやタブレットになって、その操作のスタンスは大きく変わった。

真面目に仕事している=机に向かってタイプしているという前提は壊れていったのだ。

それはよりストレスフリーでリラックスの出来るスタンスへと移行したのだ。

そして、音楽の操作に「声」が有効なら、あらゆる情報処理プロセスは人の「声」で操作する対象としても良いのではないか?

マウスやタッチインターフェイスの先にただ「聞き流し、時々つぶやく」ような(ある意味自堕落な)ユーザーインタラクションが待っていたとは、誰しも予想できなかった。

アレクサ以外はスマートフォンを主たる動作環境としていた。そこに大きな間隙があった。

「聞き流し」で構わない。

それが何ら「会話」になってなくても、構わない。

そこでコミュニケーションをしている相手が「誰なのか?」すら、構わないのだ。

ただ、聞き流すだけで、時々相槌を打ったり、茶々を入れたり、混ぜ返したり、コメントを投げてみたり。と、言うレベルで良いのだ!と言う割り切りが、彼らの「ボール」のユニークさだった。

ダラダラ聞き流す(一見とても緩い)体験の中にこそコミュニケーションの効率性や、情報の探索やマッチングなどの生産性の高さが隠れ潜んでいたのだ。

「ボール」こそ、最初の、ピュアな、「声」によるソーシャルメディアだった。

結果、彼らの果敢な賭けは図に当たり、要するにソーシャルネットとは、声で交わされるもの。しかも、何の気なしに流れてきたり、時々気分で絡むものとなった...。

フェイスブックが2000年代のウェブで創造した、画像とテキストの組み合わさった、従来型のソーシャルネットは今後も決して滅びることは無いだろう。

だが、それを眺めながら意識的にクリックしたり、タップしたりする世界が主流になる(そんな面倒を強いることが当たり前だった)日は二度と来ないだろう。

かつてフェイスブックという巨大なソーシャルが存在した。未だ無くなってはいないが。

アマゾンエコーのような音声コンピューティングが、本来声をメディアとしていたことの当然の帰結として、様々な人工知能の学習効果がスケールしたことも改めて特筆できる。

声色を読んだり、声の感情分析によって自然に気配を察したり、その前後の自然な会話の流れから発話者の意図や意志を読み取ったり、という機械学習システムは、「ボール」によるソーシャルメディアの音声化の結果、大いに進化を遂げたのだった。

今では画面を眺め人が懸命に情報処理していたあの頃のスタイルが、まるで石器時代の狩猟生活のようにさえ思えてくる。

総ての操作を人がやっていた時代は、かつての狩猟時代の様なものかもしれない。

言い方を変えれば、ユーザーインターフェイスこそがコンピューティングの価値そのものだったのだ。

声のインターフェイスで純粋に構成されたソーシャルメディア「ボール」は、アマゾンエコーの成功の直後に登場したことがそもそも何よりも大事だったと言える。

プラットフォームの入れ替わる瞬間は、まさにアプリケーションが入れ替わるタイミングでもある。それは、かつてのインターネット・ブラウザーやブログ・プラットフォーム、モバイル・アプリなどの時代の始まりで常に起こったことでもあり、これからも同じような大きな変化を我々は目撃するだろう。

その後「ボール」でドキドキは賭けに勝ち、ソーシャルメディアでの大量の「声の奔流」が生み出された。

声による自然なコミュニケーション空間。

つまり街の雑踏やカフェの喧騒の中に身を置く環境をボールは可能にした。

イギリスで出荷を待つアマゾンエコーの様子

その音響空間的なソーシャルの世界観や情報操作のスタイルに向け大きく舵を切ったことは、今振り返ると、とてもさりげないように見え、実は非常に大きな変革に向けての第一歩だったと言える。

でも、そのリラックスして音楽の流れに身をまかせるような、そんな情報環境の裏側を紐解くとすれば、例えばこういうことなのだろう。

声のビッグデータをリアルタイムに分析し、意味内容を検討し、前後文脈を考慮しながらユーザー知識レベルや趣味趣向の傾向、日々の生活内容や友人関係、仕事での課題設定、置かれた状況に寄り添ったタスクの優先度などを全て鑑みて、人工知能による高度な情報処理がその裏側で作動しているのだ(もちろん、ユーザーはそんな舞台裏での複雑な出来事をまるで気にしていないのだが)。

声のやり取りの裏側では、巨大なデータ操作と知的情報処理の高速循環システムが動作している。

考えてみれば、スマートフォン時代までの情報操作は、そう言った裏側にあるべき情報操作の多くを人が懸命にこなす他ない世界観だったとも言える。

そして、それらを隠蔽し、高度に統合した、クラウド上の人工知能によりサポートされる現在の世界観に生きる我々からすれば「ご先祖様は偉大だった!」と、いうことに尽きるのかもしれない。

2016年はフェイスブックによるチャットボットの始まりの年だった。

いずれにしろ2017年のボールのデビューが「人がただその場で、自然に聞き流しながら情報の流れと戯れる様に操作をする(操作するという意識は年々減っていくので、もう操作と言う言葉は不自然なのだが)パラダイムの先陣を切った」ことだけは確かだ。

要するにUIが声に変わることで、従来のソーシャルメディアとコミュニケーションが大きく変わった。

そしてその瞬間こそが、今のシンギュラリティ時代の本当の幕開けだったことは、多くの批評家や歴史家達の共通した見解だと言えるだろう。

2017年。それは、まさに「Play Ball!」という、新しいゲームの始まりが告げられた瞬間だったのだ。2021年の今から見ればとても大きな変化が当時は本当に僅かで取るに足らないような出来事だったことに驚きを禁じえない...。

ボールの開発当時のスローガンが、まさに「プレイボール!」だった。

(本文は2021年から2017年のボールアプリ提供開始を振り返った内容として記述した未来予測テキストです。テクノロジーの歴史がこのように変遷することを期待して書き記しました。2017年4月17日 サンフランシスコ)

8秒の声が人と人を繋ぐソーシャルメディア「Ball」を日米のAppStoreで同時リリースしました(http://apple.co/2sgKoMi)是非お試し下さい!

--

--