2019年1月23日、NTTコミュニケーションズはWebRTCでの音声・ビデオデータをクラウドサービスと容易に連携できる「Media Pipeline Factory」の提供を開始した。1月21日に行なわれた事前説明会ではWebRTCとSkyWayの技術概要、Media Pipeline Factoryのメリットなどが披露された。
標準技術で「Skype」を実現するWebRTCとSkyWay
NTTコミュニケーションズのMedia Pipeline Factoryは、同社が開発したリアルタイム通信用の基盤サービスである「Enterprise Cloud WebRTC Platform SkyWay」(以下、SkyWay)用の機能拡張キットになる。SkyWayで取得された音声や映像データをさまざまなクラウドサービスと連携することが可能になる。
SkyWayはこのWebRTC音声やビデオ通話などのRTC(Real Time Communication)をWebRTCプラットフォーム。事前説明会で発表したNTTコミュニケーションズの大津谷亮佑氏は、「Skypeとできることはいっしょだが、アプリのインストールやアカウントも不要で、匿名での利用も可能。アプリやサイトに埋め込むことができる」というWebRTCのメリットについて説明した。
WebRTCはサーバーを介さないいわゆるP2P(Peer to Peer)でのリアルタイム通信を実現すべく、HTML5の仕様の一部として標準化されている。しかし、これらWebRTCを本格的に実現しようとすると、RTPのようなリアルタイムネットワークプロトコル、暗号通信、コーデック、API、NAT超え、メディアサーバーなどさまざまな技術を自前で実装する必要がある。こうした「総合格闘技」にあたるWebRTCをプラットフォームとして提供するのがSkyWay。SkyWayのSDKを用いれば、WebサイトやiOS/Androidに通話機能を簡単に埋め込むことができる。
シリコンバレーで開発され、2013年12月に無料トライアルとしてスタートしたSkyWayだが、2017年9月に商用サービスに移行。国内での開発者の数は5000ユーザーを突破し、アプリの数も5200を超えた。オンライン英会話最大手のレアジョブがSkypeからの前提に採用を発表しているほか、オンライン診療サービス「CLINICS」などでも導入されているという。
クラウドとの連携により、音声認識や機械翻訳、VoIP通話も容易に
従来、SkyWayにはWebブラウザ、iOS/Android以外の端末しか利用できなかったが、昨年の6月に組み込み機器や家電、IoTデバイスなどでの利用を前提としたWebRTC Gatewayを投入した。そして、今回発表されたMedia Pipeline Factoryにより、クラウドサービスとの連携が可能になり、クラウドにビデオや音声を送信したり、AIサービスを利用できるようになった。
Media Pipeline Factoryが連携可能なクラウドサービスは、日本語での対話が可能なNTTコミュニケーションズのAIエンジン「COTOHA Virtual Asssistant」やGoogle Cloud PlatformのSpeech API、Translation APIなど。GUI上でコンポーネントを並び替えることで、シンプルな処理であればプログラミングなしに実装できるという。サービス自体もマイクロサービスアーキテクチャを採用されており、大量アクセスなどでも安定したサービス提供を可能にするという。
ユースケースも豊富で、AIサービスと組み合わせることで音声認識や機械翻訳、画像認識を実現したり、Amazon S3のような外部ストレージに録音・録画データを保存できる。また、SIPサーバーの連携でVoIP通話を行なったり、WiFiとCDNとの組み合わせで低遅延のライブを配信することも可能だ。
Media Pipeline Factoryは2019年1月23日より無料でのトライアルが提供され、録音、音声認識、機械翻訳など6種類のビルトインコンポーネントが用意される。SkyWayを導入しているレアジョブとはオンライン英会話サービスにおいて、発話単語やユニーク単語などを分析することで習熟度を可視化する実証実験を共同で実施する。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります