Googleは、YouTube動画内の音声を自動認識し、日本語字幕を作成・表示できる“自動キャプション”機能の提供を開始した。すでに英語では開始していたサービスで、日本語は2番目の対応言語となる。
これは音声検索などで使われる“音声認識技術”を応用しテキストを生成、音声の動画位置に合わせて、自動的に字幕を出せるというもの。これからアップロードする動画なら、数分以内に字幕が生成できる。過去の動画にも適用できるので、動画作者は試してみよう。ただし、自動で字幕を付けられるのは音声がクリアーな場合。ニュース映像などはしっかりとした音声なので大丈夫だが、バラエティーや特殊な表現の多いアニメなどは苦手という……。
字幕の自動翻訳機能と組み合わせれば、英語や他の言語がわからなくても、動画を世界に発信できる。すでに、50以上の言語に自動翻訳が可能だ。
動画の右下に、赤色アイコンの白文字で“CC”と表示している部分をクリックすると、字幕のメニューが現われる。ここで字幕の表示や、翻訳が可能だ。字幕がない動画には、このメニューは表示されない。
本日行なわれた会見に登壇した、ブラッド・エリス氏。ちなみに氏は、3月の震災のさい、災害情報を集めるサイト“クライシス レスポンス”を2時間で立ち上げたプロジェクトの中心メンバーだ。現在、YouTubeのプロジェクトマネージャーを務める。「言語の壁を乗り越え、海外の人も理解できるので日本のコンテンツを世界に発信することができる。また、耳の不自由な人も楽しめる」と語った。
YouTubeの字幕機能自体は、すでにあるサービスだ。字幕はドラッグで位置の移動、文字の大きさなど自由に変えられる。ニュースの場合、テロップをジャマすることなく視聴できる。
メニューからフォントの変更も可能。
自動作成した字幕は編集が可能。字幕データをダウンロードし、内容を編集し、再度アップロードでより正確な字幕にできる。
また字幕は、検索の対象にもなる。動画内の話した内容で検索できるので、より検索性が向上。さらに、ただ動画が見つかるだけではなく、ヒットしたワードのある位置から再生もできて便利。字幕はタイムラインリストでも見られる。
3月には、自動同期機能が日本語に対応。自分で作成した字幕のテキストをアップロードすると、音声認識により、音声の位置と字幕が自動で同期し、字幕が作成できる機能だ。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります