週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

なんやてえ!標準語を関西弁に変える超技術 NTTが開発

ntt

 世界初でっせ!

 NTT研究チームであるNTTコミュニケーション基礎研究所が、おもろい研究をやっている。6月4~5日、京都・京阪奈ビルで開催する無料の技術展示会『オープンハウス2015』。特別に展示予定の研究を一部見せてもらったのであった。


●標準語を関西弁に変換する技術

 まずは標準語を関西弁に変換する技術。

「あらゆる韻律をすべて関西弁の方にねじまげたのだ」

 音素バランス文めいた文章をマイクに向けて読みあげると、自動的にアクセントとイントネーションのパラメーターが割り振られる。パラメーターをいじって再生すると、自分の声がちょっと変な感じで聞こえてきた。

「あら↓ゆ↑る↓韻律をす↓べ↑て↓……」

 ……う、うーむ。関西弁と言われれば関西弁か。

000
上が声紋、下が抑揚などのパラメーターだ

 音声のパラメーターをいじるという発想そのものはボーカロイドっぽいが、パラメーターを作る際の技術的アプローチが違う。

 人が声を出すときは、口の奥にある甲状軟骨という場所が動いている。なら、その動きをパラメーター化してしまえば人間の発声パターンを制御できるのではないか。よりサイバネティクスに近い発想をしたのがNTTだ。

「人間の発声には物理的な制約があり、そこから少しでも逸脱すると不自然なものになってしまう。モデルパラメーターの推定は40年前から提案されていたんですが、これまで未解決の課題だったんです」

 NTTでは世界にさきがけ、高精度かつ高速なパラメーター推定に成功したという話であった。ちなみに1969年につくられた初期モデルを藤崎モデルという。

ntt
甲状軟骨の模式図

 技術が進めば、聞こえづらい音声にメリハリをつけたり、声の演技を録りなおすことなく、パラメーターをいじるだけで簡単に抑揚を修正できるようになるのではないかと言っていた。声優さんの未来なり。

 ちなみに隣には音声のリズムを変えることで「日本人のカタカナ英語をネイティブ英語に近づける研究」というのもあった。統計解析からリズムパターンをつくり、そのパラメーターにあてはめ、それっぽく聞こえさせるしくみである。

 英語発音がイケてないなら技術力で変えちゃおうというのもなかなかクレイジーな発想でよいのではないかと思った。

ntt
カタカナ英語もネイティブ英語に変換可能


●目で音を測る技術

 つづいて試したのは「目で音を測る」という意味不明気味の技術である。

 被験者はイスに座ってヘッドホンをかぶり、ディスプレイをじっと見つめる。「ざあああ」「ちゅんちゅん」「ぴー」といった音が聞こえたタイミングでボタンを押す。

000
注意をひきつける音を目で測る

「これでわかるのが、瞳孔径の変化です」

 NTTの人にそう言われグラフを見ると、音声が流れたあと瞳孔がひらいている。要は音にハッとして目がカッとなっているのであった。きっと緊急地震速報が流れたときはヤバいことになっているにちがいない。

ntt
波線が瞳孔のサイズ、縦線が音をあらわす

 現在10種類ほどの音声をもとに瞳孔径の変化を追っているそうだ。

「たくさん試してデータをためると、たとえばCMでどんな音を流せばいいのかが分かるようになるんじゃないかと」

 技術はいいと思うのだけど、とにかく瞳孔を開かせること、記憶に残らせることだけを重視して、YouTubeでギョッとするような音のCMが増えないといいなあ。新発売!バーン!ドカーン!ジャーンジャーンジャーン!げえっ!!最後違う。


●光を使ってドキドキを伝える技術

 お次はちょっと音声から離れて光の技術。

 可視光により心臓の鼓動を波形パターンとして伝えられる、伝わってどうなるんだというコンセプトがわりと謎の技術である。

 すごいのは、普通のカメラ1台で64個の光源を同時に分析できるということだ。つまりカメラ100台があれば6400人分の心臓の鼓動が波形パターンとして入手できるわけである。だからそれ入手してどうするんだという謎はあるのだが。

 のっけるのは心拍数だけでなく、音声信号であっても映像信号であってもよい。

「コンサートホールであったり、ニコニコ超会議であったり、混雑してWi-FiやBluetoothの通信がつながりづらくなってしまう場所で使えるんじゃないかと」

ntt
心拍数を測るシャツ「hitoe」についたライト
ntt
可視光化された信号をカメラでキャッチ
ntt
解析すると波形データが出力できる

 以前は可視光にのせた音声や信号のパターンを解析・表示するのに巨大なコンピューターが必要だったが、研究をつづけてきた結果、普通のコンピューター程度の大きさ・軽さにまとまったということであった。

「そのうちドローンに積むこともできるんじゃないかと」

 とのことで、ドローンがライブ会場を飛び、心拍数の分析にあたる日も近そうだ。たとえばhitoeと連動したケミカルライトの輝きから心拍数がとれるようになったら気持ち悪くてヤバそうである。ぜひ率先して日本でやってほしい。

009
まだ光源は小型化の余地があるそうだ


●そうだ、京阪奈行こう

 NTTコミュニケーション基礎研究所ではメディアや人工知能を軸に、このほかにもいろいろおもろい研究をやっている。先日のっけた「おさわりバイブ」(わたしが勝手にそう呼んでいるだけである)など、未来技術ぞろぞろ。さすがの大資本である。

 そんなわけで今週末はオープンハウス見物を入れて京都出張をご提案したい。京都は中華料理もうまいしね。二条の草魚とか。あと、わたしとしては京都じゃないものの大阪・シンセ界ツアーもおすすめしたい。そっちもぜひご参考に、よい旅を!

●関連サイト
オープンハウス2015
NTTコミュニケーション科学基礎研究所

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう