キーボード左下のマイクボタンを押すだけ |
これほんとにすごい、アップルもっと騒いでもいいのに。
iOS 8から音声入力の精度がよくなっているという話を聞いて、本当かな〜と試してみたところ、本当に信じられないくらいのレベル。
速度はほぼリアルタイム、誤字は異様なほど少ない。あんまり精度が高いものだから「やっばい、これやっばい」と笑ってしまった。
使い方は入力用キーボードを出し、左下にあるマイクボタンを押してしゃべるだけ。入力時間は40秒ほどに限定されるが、フリック入力より断然早い。一度音声入力に慣れると、フリック入力の誤字が心底いやになる。
句点は「マル」、読点は「てん」、エクスクラメーションは「びっくりマーク」などで入力できる。「改行」というと改行してくれる。「開業医の先生」と言いたくても改行されるのは何なので、辞書登録できるといいなあ。
声に出して読んでみた
小説を音読してもきれいに認識する |
写真:Rosmarie Voegtli |
ためしに『吾輩は猫である』冒頭を読む。
吾輩は猫である。名前はまだない。
どこで生まれたのかとんと見当がつかん。何でも薄暗いじめじめした所でニャンニャン泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは所詮と言う人間の中で1番道悪な種族であったそうだ。
これで修正なしだ。改行も句読点もそのまんま。決定的な間違いは「書生」が「所詮」、「ニャーニャー」が「ニャンニャン」になったくらい。漢数字が英数字になっちゃうのはまあ仕方ないかな、というところ。
次はジョージ・オーウェル『一九八四年』。
4月のある晴れた寒い日で、時計は13時を売っていた。ウインストン・スミスは嫌な風を避けようと顎を胸元に埋めながら、足早に勝利マンションズのガラスドアから滑り込んで行ったが、さほど素早い動作でもなかったので、1人の砂埃がともに舞い込むのを防げなかった。
こちらも「打って→売って」「1人→一陣」の誤字があるが、あとは正確。ウインストン・スミスは「ウインストンなかぐろスミス」と読めばちゃんと出てくる。というか「勝利マンションズ」なんて意味不明な言葉がちゃんと入力されたのがすごい。どうなってるんだ。
早口でオーケー、LINEが便利
マイクに向けて話すだけである |
写真:John Karakatasanis |
どのくらいの入力でいけるか。
ぼそぼそ話すとダメだが、逆に早口でも発音がしっかりしていればOK。都心のうるさいところだとさすがに精度は落ちる。それでもまだ日常用途なら普通にいける。
LINE、SMS、メモくらいであればまったく問題なく使えるはずだ。場合によってはパソコンのキーボードで打つより早く相手に返信できてしまい、たいへん衝撃的だった。
都心で実験したとき、たまたまLINEのようなアプリで音声入力をしている女の子を見かけた。聞こえてきた言葉は中国語らしく、メッセージがおそろしく早いスピードで出ているのがチラッと見えてびっくりした。
マイクに口を近づける必要があるため、さすがに取材や会議で相手の声をそのまま起こすことはできない。が、録音してある声ならいける。静かな部屋でMacBook Airのスピーカーからニュース番組を聞かせると、こうなった。
昨日午前9時ごろ北アルプスの屏風岩で岩登りをしていた埼玉県の60代の男性が宙づりになりどこをしていた東京都の60代の男性が警察に救助要請しました同行の男性は千葉にしがみついた状態だったということですこの男性については警察の朝午前8時前ヘリコプターで救助しましたニコ厨それになっている男性は用意した長いのと使って4チャンネルなどして続いています
二コ厨などふしぎな誤字は多いが、おおむね文意が伝わると思う。インタビュー音声など雑音が増えると一気に精度は落ちるが、ノイズが少なければ入力補助になるはずだ。
音声入力は究極の「言文一致」
いままでは「英語はよくても、日本語の認識はまだ先だろうよ」と思っていたが、今回の一件で意識は180度変わった。
アマゾンが音声認識デバイス『エコー』を出したときは、また変なものを出したなと思っていたが、わたしは愚かだった。
音声入力は間違いなく「文字」との付き合い方を変える。口語と文語が本当の意味でひとつになる、デジタルとアナログが一体化する、そんな大げさなことを言いたくなるほど、驚きの大きな体験だった。
ほんとにすごいよ、これ。おためしあれ。
-
1,254円
-
1,680円
-
2,490円
-
1,300円
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります