2016年03月09日16時31分

性別、年齢などを操作して声を自在に合成する「声デザイン技術」、東芝

  • このエントリーをはてなブックマークに追加
  • Pocket
東芝、声デザイン技術
声デザイン技術

 東芝は3月8日、用途にあわせて多様な声を簡単かつ自在に音声合成で作成できる「声デザイン技術」を開発したと発表した。

 独自のモデル最適化方式により、性別・年齢・明るさなどの知覚的な声の特徴を示す複数の要素(知覚語)に分解してモデル化した「知覚語空間モデル」を開発。この空間モデルを操作できるGUIを試作し、各要素の強度を変化させて声を自由に作成できる。

東芝、声デザイン技術
声の「知覚語空間モデル」

 さらに、求める特徴の声を簡単に作り出せるように、かわいい・知的・丁寧といった声の印象を表す印象語から「知覚語空間」の座標を定める「印象語変換モデル」も開発してGUIに組み込んだ。かわいい・知的などの印象語やキャラクターの顔画像からベースの声を選定し、さらに性別や年齢などで絞り込み、利用者のイメージに合った声を効率的にデザインできる。

 同社では、クラウドサービス「RECAIUS(リカイアス)」に2016年度中に搭載することを目指して研究開発を進めるとしている。

関連記事

あわせて読みたい

follow us in feedly

最新のニュース

アスキーストア人気ランキング

特集

Comic

アクセスランキング

Like Ranking

BEST BUY

みんなが買っている最新アイテムはこれだ!