↑北京市街の北西部、ハイテク企業が集まる地域に位置するマイクロソフトの北京法人ビル。ここにMSRAがある。
Microsoft Reseachの研究成果のうち、今、最もホットなものといえば、なんといっても“Kinect”だろう。人間の動きを認識し、ゲームはもちろん、さまざまなアプリケーションの入力デバイスとして使われるようになってきている。顔認識の部分は北京で、スケルトントラッキングの部分はケンブリッジ、オーディオに関してはレドモンドと、こうした発明は、いきなり生まれるのではなく、日常的な地道な基礎研究の積み重ねの成果なのだ。
研究範囲は広いが、主なフォーカスエリアとして、
・データインテンシブコンピューティング
・マルチメディア
・コンピューター・サイエンス
・サーチ
・ナチュラル・ユーザー・インターフェース
の5方面に注力している。
今回の訪問では、同研究所に所属する研究者数名から、最新の研究成果のプレゼンテーションを披露してもらうことができた。
●ギガピクセルカメラによるハイクオリティ・デジタル・イメージキャプチャ(Moshe Ben-Ezra)
4年間かけて3D対応のギガピクセルカメラを開発してさまざまな被写体を撮影、ズームアップすれば油絵のディティールまでもがわかる写真や中国・敦煌の洞窟の細部がわかるギガピクセルイメージを撮影するなどの作業の中で、ビジュアルコンピューティングを追求している。
↑dgCam - A Digital gigaPixel Camera(関連サイト)。
●Mind Finder(Changhu Wang)
手書きのイメージスケッチから画像を検索するシステム。線画を手書きするだけで、それに近いイメージ画像を検索することができる。Windows8ではタッチのインターフェースが積極的に取り入れられ、多くのデバイスがタッチスクリーンをもつことになる。これからの時代のイメージサーチを追求すると、当然、スケッチを描けば検索できるようにするべきという発想で生まれたプロジェクト。
↑MindFinderを使えば手書きのスケッチから画像を検索できる。
↑こんな手書きスケッチから花火や花の画像が検索される。
デモ-Mind Finder
●Bing Dic(荒瀬由紀)
自然言語処理への注力もこの研究所の特徴。この辞書は、膨大な翻訳知識データをクリーニングして品質の高いものだけを抽出、中国語と英語に対応するサービスとして実現した。すでに中国のBingに実装され、正しいスペルを提案したり、ウェブから抽出してきた豊富でホットな例文などを提示する。母国語以外では、単語のスペルがわからないと調べるのも難しいものだが、スピーチテクノロジーを使って発音から検索するなどの機能も実装されている。英語-日本語間の対応も進められている。
↑Bing Dictionary(関連サイト)。
↑荒瀬さんをはじめとする、MSRAで研究にいそしむ5人の日本人。もうすぐ6人目が加わる予定だ。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります