週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

グーグル、マイクロソフト猛追 ChatGPT対抗の鍵は「マルチモーダル」「全方位」

2023年05月16日 12時00分更新

グーグル兼アルファベットCEO スンダー・ピチャイ氏

グーグルがAIへの本気度を示したGoogle I/O 2023

 5月10日にアメリカ・マウンテンビューにあるグーグル本社横にある屋外ステージで開催された同社の開発者イベント「Google I/O」。現地で参加したメディアには基調講演だけでなく、グーグルの社屋においてAIに関するラウンドテーブルやパネルディスカッションなども取材する機会が与えられた。

 今年のGoogle I/Oは、間違いなく「グーグルはAIに本気」というところを世間に示したかったようだ。ただ、グーグルとしては「ChatGPTに比べて遅れている」というイメージを払拭したいようだ。

 幹部からは「何年も前からAIの開発に取り組み、すでに多くの製品に搭載され、世界の人々の生活を支えてきた」というアピールが何度も披露された。

 筆者は10年以上、Google I/Oを現地で取材しているが、ここ5年近くは少なくともAIに関しての発表が結構、多かったほどだ。グーグルとしては「ぽっと出のOpenAIにAIのリードしているイメージを奪われたくない」という忸怩(じくじ)たる思いに駆られているのかもしれない。

 世間やメディアからすると、「OpenAIのChatGPTとマイクロソフト陣営vs.グーグル」という対立構造を期待したくなってくる。

 OpenAIがChatGPTによる生成AIを出しつつ、同社に出資しているマイクロソフトがChatGPTをベースとしてリニューアルした検索サービス「Bing AI Chat」を投入。さらにMicrosoft365では、Co-Pilotとして、AIがユーザーの仕事を助けてくれるような機能を盛り込んだ。

Bardの強み「マルチモーダル性」

 今回のGoogle I/Oでは、Bardのアップデートが発表された。BardはまさにChatGTPやBing AI Chatに対抗するサービスと言われている。2023年3月からアメリカ・イギリスの英語でサービスが始まり、Google I/Oで日本語と韓国語の対応が発表された(今後、40以上の言語に対応)。

 Bardの強みとなってくるのが「マルチモーダル性」だ。

 マルチモーダルとは文字だけでなく、画像や音声などのコンテンツを扱えるようになる。質問に画像を組み合わせてもいいし、逆に回答に画像が出てくることもある。

 グーグルがChatGPTやBing AI Chatよりも便利になる可能性があるのが、グーグルは様々なサービスを持っているという点だろう。

 Bardに質問した際、住所が出てくればGoogle Mapから地図を表示できるし、テキストで伝わりにくいならYouTubeから動画を引っ張ってくることも今後、不可能ではない。グーグルが提供しているサービスを横断的にBardが検索し、簡潔にまとめて見せてくれるようになると、結構、便利になりそうだ。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

この特集の記事