週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

2017年の総括その1:声のインターフェイスの進化

2017年12月13日 10時00分更新

文● 松村太郎(@taromatsumura) 編集● ASCII編集部

操作の不確実性をいかに排除するか?

 音声アシスタントを使うようになった際の問題点は、不確実性と待ち時間だと思います。

 もちろん音声認識の精度は日進月歩で上がっていきますが、母国語であっても、回りが騒がしかったり、ちょっと言いよどんだりすると、間違った言葉として認識されたり、違う機能が呼び出されたり、「よくわかりませんでした」とつれない返事が返ってきたりします。もう一度言い直して、目的通りに認識されるまで試さなければなりません。

 この問題点は普段スマートフォンなどをタッチで操作している場合は発生しないことです。画面表示に合わせて指で操作するため、あらかじめ何ができるかが分かりやすいし、間違っても最初からではなく1つ前の画面に戻って操作することがほとんどです。そうした階層や順序に沿った操作は、音声入力ではまだまだやりにくい印象。

 「ツー」といえば「カー」みたいなテンポの良さで、掛け合いながら機会に声で操作を話していくには、機会側の認識ももちろんですが、人間側の乗りの良さも求められそうですし、画面で実現しているインターフェイスを声に置き換えるという概念自体を、なんとかしなければならないでしょう。

 Google Homeは最近、2つの命令を同時に受け付けてくれる機能を獲得しました。たとえば、夕方に料理をしていて煮込む時間を計るときに、部屋が暗くなってきたから電気も付けたいと思ったら、「部屋の電気を付けて5分タイマーで計って」と言えば、それぞれの命令を受け付けてくれる、というものです。

 手順のショートカットは、音声入力ならではの手軽さをもたらし、また不確実性も減らしてくれるでしょう。このあたり、使う人と音声アシスタント側のコミュニケーションで作り上げていく必要がありそうです。

音声アシスタントの進化もやっぱりApple待ち?

 音声アシスタントの進化は、対応アプリの増加ではなく、いかにその人の行動パターンや普段使っている機能を理解していくか、にかかっているのではないでしょうか。

 そう考えると、やっぱり家にいるときしか話をしないスマートスピーカーよりも、スマートフォンやスマートウォッチの音声アシスタントに分があるのではないかと思うのですが、AppleのSiriの進化もゆったりとしたスピードに留まったままです。

 AppleはWorkflowというアプリを買収しました。このアプリは、誰かに電話する、誰かにメールする、位置情報をツイートするといった、iPhoneでよくやる操作のショートカットを作成することができるアプリです。

 たとえばSiriに対して、自分が良く使う機能のショートカットを作成して声で呼び出せるようにすれば、前述の操作の確実性が格段に上がるだけでなく、Siriを育てていく感覚が得られるようになるでしょう。加えて、SiriがユーザーのiPhoneの使い方から、自動的にWorkflowを提案してくれるようになると、勝手にカスタマイズが進むアシスタントのできあがりです。

 まだ先の話になるかもしれませんが、2018年の実現に、期待していきたいと思います。


筆者紹介――松村太郎

 1980年生まれ。ジャーナリスト・著者。慶應義塾大学SFC研究所上席所員(訪問)。またビジネス・ブレークスルー大学で教鞭を執る。米国カリフォルニア州バークレーに拠点を移し、モバイル・ソーシャルのテクノロジーとライフスタイルについて取材活動をする傍ら、キャスタリア株式会社で、「ソーシャルラーニング」のプラットフォーム開発を行なっている。

公式ブログ TAROSITE.NET
Twitterアカウント @taromatsumura

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この特集の記事