日本マイクロソフトは4月7日、Skype 翻訳などのMicrosoft Translatorを活用したすべてのアプリとサービスで、日本語をサポート言語として追加すると発表した。同サービスでテキスト翻訳および音声翻訳の双方が可能な10番目の言語となる。
来日観光客数が増加傾向にあるほか、今後数年間に世界的スポーツイベントが開催されるという近年の状況を支援するため、同社はAIによる日本語の音声認識と機械翻訳への投資を数年前に決定していた。今回の発表により日本語ユーザーは、英語や中国語などのサポート済み9言語の話者とリアルタイム対話ができるようになる。
同社は音声翻訳を音声認識エンジンと翻訳エンジンの単純な接続ではないと指摘。2014年12月にSkype 翻訳の提供を開始し、2015年にMicrosoft Translator APIとアプリを提供開始したが、新しい言語の追加はAIと自然言語処理の専門家チームによる、あらゆる言語が持つ固有特性への対応作業が必要だったとする。
今回の音声翻訳は、独自技術「TrueText」を用いた音声認識用と、機械翻訳用の異なるAIを組み合わせることで実現する。
音声認識はまず、日本語の「えーと」や英語の「um……」といった言い淀みに相当するつなぎ言葉(ディスフルエンシ)を含んだテキストが生成される。TrueTextはこれらディスフルエンシを削除し、文頭や特定名詞の大文字化、句読点を追加するなど、翻訳での適切な処理を可能にする。
最後のステップで、テキスト読み上げ機能が生成文を音声に変換する。
同社ではOutlookやMicrosoft Edgeのアドインを使用した電子メール・ウェブサイトのチェック、ウェブサイトや各種デバイス向けMicrosoft Translatorアプリによる短文や単語の翻訳といった使い方を提案している。あるいはMicrosoft Translatorのライブ機能による多言語議論、PowerPointを使ったプレゼンテーション、さらには来日観光客向けの通訳なども可能とする。Azure上のMicrosoft Translator Speech APIを使用して音声翻訳機能を自分のアプリやサービスに取り込みもできる。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります