米グーグルが5月17日、次世代の検索技術“ナレッジ・グラフ(Knowledge Graph)”を同社の公式ブログで発表した。
ナレッジ・グラフは、ブログ記事のタイトル『Introducing the Knowledge Graph: things, not strings』にもあるとおり、検索ワードを“単なる文字列でなく、物事として”捉える検索を実現するという代物。検索ワードの意味(検索者の意図)を理解してぴったり当てはまる結果を導き出す検索、いわゆる“セマンティック検索”への第一歩となる技術となりそうだ。
グーグル検索が、ナレッジ・グラフによって強化されるポイントは以下の3つ。
【1】 2通り以上の解釈ができる検索ワードを明確化
グーグルは、例として“Taj Mahal(タージ・マハル)”を検索した場合を挙げている。この検索ワードが“インドにある世界遺産の建築物”を意味するのか、それとも“ミュージシャンの名前”なのか、あるいは“近所のインド料理店”なのか。ナレッジ・グラフではこれらの候補の違いを理解して、検索結果をユーザーの求めるものに狭める手助けをしてくれるという。
【2】 検索ワードに関する概要を表示
次にグーグルが挙げた例は“Marie Curie(キュリー夫人)”。このワードで検索すると、キュリー夫人の人生についての要約と関連情報が表示される。表示される関連情報は、過去にそのワードがグーグル検索で検索された履歴を分析し、多くのユーザーが知りたがっている事柄を推測し、優先順位を付けてくれる。
【3】 より深く広い知識の提供から、予期せぬ発見ができる
これは、上で紹介した関連情報から生まれる効果だ。たとえば、検索ワードが人物であれば、その人の生誕地や配偶者の名前、発表した作品、執筆した書籍などの情報が表示されるため、そこからユーザーは知識の幅を簡単に、効率よく広げることができる。“思わぬものをたまたま発見する才能”を英語では“Serendipity”と表現しますが、ナレッジ・グラフはこの“Serendipity”を“検索”という行為で得やすくしてくれるわけ。
さて。ここまで読んで「え、それって、Wikipediaでいいんじゃないの?」と思った人もいるだろう。実際にナレッジ・グラフは、そのWikipediaのほか、Freebase(セマンティック検索のオンライン・データベース)やCIAワールド・ファクトブックなどを利用しすることで構築されており、現在、含まれるオブジェクト(人名や地名など)の数は5億件以上。さらにこれらのオブジェクト間の関係性や定義などは、なんと35億件にも上るそう!
さて、気になるナレッジ・グラフの一般公開だが、まずは英語版(米国)のユーザーに向けて、数日中に開始される予定だ。日本版の公開は未定だが、いずれ公開されるはず。このGoogle新検索技術によって、web検索体験がどう変わっていくのか、楽しみなのは事実だ。
■関連サイト
Google Official Blog(英語)
Introducing the Knowledge Graph(英語)
紹介ビデオ(英語)
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります