中国の検索エンジン大手 百度(Baidu/バイドゥ)は3月16日、開発を続けてきた会話型AI「ERNIE Bot(中国語表記では文心)」の最新バージョンを発表。CEOのロビン・リー氏は「この製品は先日発表されたOpenAIの最新大規模言語モデル“GPT4”と近い能力を備えている」と自信を見せている。
すでにメディア企業、銀行、自動車会社など650の企業がERNIE Botの技術を利用する契約を結んでいるとされており、同社の「Baidu AI Cloud」ユーザー企業に向けたウェイティングリストも公開されたが、利用料金および一般ユーザーへの公開時期は明らかになっていない。
中国市場にフォーカスしたトレーニング
新しいERNIE Botは、数兆のウェブページ、数十億の検索・画像データ、数十億の音声通話、5500億の知識グラフでトレーニングされており、テキストだけではなく、画像、音声(方言を含む)、動画を生成できるマルチモーダルかつ汎用性の高いチャットボットだ。
対話力、情報分析力、コンテンツ生成力に優れており、追加の強化学習を行なうことでさらに精度を高めることができるという。
特徴的なのは、トレーニングデータのほとんどが中国市場にフォーカスしていることだ。その結果、さまざまな中国語の方言で発話された音声データを認識したり、中国独特の故事成語について深い洞察を含んだ回答をすることが可能になっている。
テキストだけではなく音声や画像も生成
Meet #ERNIEBot - with its unparalleled ability to engage in dialogue, analyze information, and generate content, it's the go-to choice for writers. Plus, its knowledge enhancement boosts accuracy in answering factual questions. pic.twitter.com/DMZ4Q9t6Dz
— Baidu Inc. (@Baidu_Inc) March 16, 2023
このデモ動画では、中国のSF小説「三体」を要約し、続きを提案してもらったり、映画版の俳優をリストアップし、どちらが背が高いかという質問に答えている。
ERNIE Bot is a versatile model that can generate text, images, audio, dialect speech, and video.#Baidu#ERNIEBot#AI#generativeAIpic.twitter.com/NUX4MhBvkz
— Baidu Inc. (@Baidu_Inc) March 16, 2023
すごいのがこのデモ動画。スクリプトによる画像生成はもちろん、方言(四川語)を使って発話された説明を文字起こしするだけではなく、それをスクリプトにしてナレーション付きの動画を生成しているように見える。
だが、プレゼンテーションの中でリー氏も「まだ完成していないが、需要が高いため発表に踏み切った」と語っているように、ERNIE Botはいまだ未完成だ。
発表もリアルタイムのデモはなく、すべて事前に録画されたものを使用していたため失望を呼び、香港市場での株価は一時的に10%下落、終値も6.4%安となった。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります