2018年07月31日08時00分

全人類の「デジタルクローン化」を目指す、オルツの最新技術

  • この記事をはてなブックマークに追加
  • Pocket

 P.A.I.(パーソナル人工知能)「al+(オルツ)」を開発する株式会社オルツは、7月12日、ベルサール六本木にて「P.A.I.カンファレンス2018 ~OPERA~」を開催。個人のデータをセキュアかつ永遠に保存する分散型個人データストレージ・プラットフォーム「al+ stack(オルツ・スタック)」、分散型ニューラルネットワーク基盤「al+ emeth(オルツ・エメス)」、およびalt対話エンジンを発表した。

 またこれらの技術を活用した製品・サービスとして、VUI(音声認識でのユーザーインターフェース)を活用するための開発者向け製品「altGoプラットフォーム」を発表し、NTTコミュニケーションズ株式会社など企業との取り組みについて紹介した。

ol-Photos

すべての個人のデジタルクローン化を可能にする
Stack&emethプロジェクト

 カンファレンスの第1部では、「Project Stack & Project emeth」と題し、株式会社オルツCTOの西村祥一氏と同社エンジニアのAsir Saeed氏が登壇。「al+ stack」と「al+ emeth」の機能と目的を解説した。

ol-Photos
株式会社オルツCTO 西村祥一氏

 オルツでは、対話、顔、音声モデルのデジタルクローンを研究開発しており、将来的には、すべての人類が総デジタルクローンをもつことを目指している。現在のアーキテクチャーでは、すべてのデータをオルツ社のサーバーに置いて保管し、モデル化の処理もサーバー上で行なっているが、一般消費者向けに提供するためには、ストレージと処理能力の確保が必要になる。

 そこで、データの保管場所として開発されたのが、分散型データストレージ・プラットフォーム「al+ stack」だ。個人の存在要素である、言語、外見、音声、コミュニケーション、行動履歴といったさまざまなデータを収集し、暗号化して分散ストレージに保管する。またハッシュ値をブロックチェーンに記録することで、機密性と完全性が確保される。保管されたデータは、秘密鍵を使うことで本人のみがアクセスできるようになるとのこと。

ol-Photos

 次に、人工知能を学習させるための膨大な演算を担うのが「alt+ emeth」だ。分散コンピューティング技術とニューラルネットワーク技術を組み合わせた仕組みで、インターネットを介して世界中のパソコンやサーバーの余剰能力をネットワーク化し、分散処理させることで大規模な演算処理能力の確保を可能にする。

 al+ emethでは、オルツが分散型ニューラルネットワークの基盤を提供し、ニューラルネットワーク自体は、ネットワークへの参加者ノードの集合体によって構築される。参加者には、演算処理能力を提供する対価として、仮想通貨emethが支払われることが想定されている。

ol-Photos
利用者は、演算能力を利用する対価として仮想通貨emethを支払うことで、エコシステムを形成

 続いて、株式会社オルツ 代表取締役 米倉千貴氏が登壇し、オルツの今後の戦略について発表した。

ol-Photos
株式会社オルツ 代表取締役 米倉千貴氏

 オルツの全体像として、1970年にオムロンの創業者が発表した未来予測理論「SINIC理論」を挙げ、「現在は、最適化社会から自律社会への移行期に差し掛かっている。自己実現だけに集中できる社会を実現するため、オルツは自分自身の存在をクラウド上に復元して、個人の価値を永遠化するデジタルクローンを作っている。これこそが自律社会の社会的不安を払拭して、人を圧倒的に自由にする最適な答えだと考えています」と語った。

 現在の技術で収集できる個人データだけでは、個人を完全に復元するには不十分だ。しかし、より多人数のデータと比較することで精度が高まる。オルツの個性抽出モデルでは、少量の個人データと多人数のデータを比較し、差を抽出することで、言語や音声のクローンを生成する。最低40人のデータがあれば、ひとりの個性を抽出可能、とのこと。

ol-Photos
Parsonal DataとCommon Sense Dataと比較し、差を抽出することで、言語、音声、容姿のクローンを生成できる

 オルツの主要プロジェクトは、脳の記憶をつかさどる「al+ stack」、脳の反応をつかさどる「al+ emeth」、そこから取り出されるパーソナル汎用反応モデル「PAI model」の3つ。

 これらのデータへのアクセスするための「オルツ Browser」をクライアントアプリケーションの形で提供し、自然言語処理を使ったスマートスピーカーアプリケーション「alt Go」や対話エンジンなどの開発を進めている。

ol-Photos
オルツの主要プロジェクトは、脳をデジタルで再現する「al+ stack」、「al+ emeth」、パーソナル汎用反応モデル「PAI model」の3つ

人間のように自然な会話ができる「alt対話型エンジン ver1」

 続いて、同社のChief Scientific OfficerのDanushka Bollegala氏より、「alt対話エンジン Ver1」が発表された。

ol-Photos
株式会社オルツ Chief Scientific Officer、英国リバプール大学准教授Danushka Bollegala氏

 alt対話エンジンは、人間のように自然に、さまざまなトピックについて会話ができる対話エンジンを目指している。ルール(AIML)・既存の知識ベース(KB)から情報抽出し、深層学習による回答生成(RNN:再起ニューラルネットワーク)と質問生成を組み合わせたことにより、さまざまな観点から対話ができるのが特徴だ。これらの要素をすべて備えた対話エンジンとしては、日本語・英語ともに世界初となる。

ol-Photos
自然な受け答えを実現するため、AIMLルール、知識ベース、RNNによる回答/質問生成、意図認識といった複数の技術を採用

 AIMLルールを用いると様々な人格をもつ対話エンジンを簡単に構築できるが、ユーザーの発話がルールとマッチしないと回答できない、という欠点がある。

 この対策として、よみがな変換で表記ゆれの吸収、単語エンベディングを使うことで関連語にも対応している。

 また、ルールベースでの回答は決まった受け答えしかできないが、RNN対話モジュールは、ユーザーからの質問に対して新しい発話を生成できる。さらに、質問に答えるだけでなく、対話エンジンからも会話の流れに合わせた質問を返すことで、自然な会話を続けられる。

ol-Photos
会場にはデモブースが設置され、実際に対話エンジンが体験できた

セキュアでシンプルなVUIアプリ開発を可能にする
「alt Goプラットフォーム」

 カンファレンス第2部では、新製品のスマートスピーカーアプリケーション開発プラットフォーム「alt Go」について副社長の米倉豪志氏が紹介した。

ol-Photos
株式会社オルツ 代表取締役 副社長 米倉豪志氏

 現在のVUIは、大規模なアプリケーションをつくろうとするとフローが複雑になり、ユーザーが迷子になりやすい。これは、アプリケーション間の連携ができないことが原因と考えられる。「altGo」は、VUIに必要な仕組みとして、1.アプリ間呼び出し機能、2.アプリ間データ連携機能、3.altGo認証(特許出願中)の3つを実装する。

 たとえば、スマートスピーカーに「おいしいラーメン屋を教えて」と話しかけると、レストラン検索アプリによって店名が返る。次に、「ナビをして」と話しかけると、アプリ間データ連携機能により、店名を伝えなくても、先に検索したお店へ案内してくれる。

 3つ目の「altGo認証」は、複数の暗証番号を管理するわずらわしさを解消するものだ。現状の認証では、スマートスピーカーを通して銀行のアプリなどにアクセスする場合、暗証番号を声に出して読み上げる。GUIではブラウザーなどにパスコードを保存できたが、VUIでは、すべて人間が記憶しなくてはならない。第三者に聞かれると、乗っ取りの危険もともなう。

 こうした問題を解決するために、「altGo認証」では、単純な単語の組み合わせにより生成されたパスコードを頻繁に新規生成する。

 たとえば、「おはよう、ひまわり、カレーライス」の3つの単語でセキュアなパスコードが生成される。これは、小学校6年間で覚える約2万語の単語を順列重複で組み合わせたもので、約4兆ものパターンになるという。

 パスコードは時限装置になっており、24時間/1週間/任意のタイミングで自動的に新規のパスコードに書き換わるように設定可能で、常にセキュアに保つことができる。

 さらに、他人の端末で認証をアクセスしようとする場合、2段階認証を用いて、なりすましを防止する。ユーザーの個人認証が可能になるため、自宅だけでなく、外出先などに設置されたスマートスピーカーを不特定多数の人が利用できるようになるという。たとえば、宿泊施設のスマートスピーカーでは、個人の嗜好に合わせた名所案内が可能になる。

ol-Photos
生成されたパスコードはスマホに表示され、スマートスピーカーからアプリケーションへログインしようとすると、altGo認証サーバーで照会が行なわれる

 後半では、パートナー企業とのaltGoプラットフォームを利用した取り組みが紹介された。NTTコミュニケーションズ株式会社からはVUI(ボイスユーザーインターフェース)を活用した遠隔会議のデモビデオを紹介。また株式会社電通デジタルでは複数のプロジェクトが進行中で、今夏から秋かけて実証実験を行なう予定とのこと。

 「altGo」は、一部限定したクライアントに提供されており、順次一般公開される予定だ。

■関連サイト

関連記事

あわせて読みたい

最新のニュース

アスキーストア人気ランキング

アクセスランキング

Like Ranking