画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画像を生成するというものの可能性を超える存在を狙うことを予告したと。この目標はすなわち、画像生成AIをゲームエンジン化することを意味しています。
Midjourney CEO in office hours just said he thinks they “can get to the holodeck” by 2024 😳
— Nick St. Pierre (@nickfloats) January 3, 2024
“We’re gonna build a lot of stuff this year. I think we’ll build more stuff than I’ve ever built before…By the end of 2024 hopefully we have real-time open worlds”
Holy shit
ホロデッキというのは、SF作品の「スタートレック」の宇宙船に装備されているAR的な特別な装置のある部屋のこと。特定の世界を生み出すようコンピューターに指示すると、現実と変わらないほどのリアルさで、その世界が瞬時にできあがるというものです。様々な物語を展開するために有効なSF的な舞台装置ですが、メタバースの分野ではこの実現がゴールの1つとされてきた面があります。デイヴィッド・ホルツCEOは、画像生成AI技術を発展させるアプローチによってこれを実現させようとしているわけです。
ホルツ氏は「Midjourneyはすごく速く描けるアーティストではなく、むしろ、とても遅いゲームエンジンのようなもの。将来は1分間に1枚の(生成)画像ではなく、60fpsのフルボリューメトリック3Dになるでしょう」とも述べたそうです。
Nick St. Pierreさんによれば、ホルツ氏は過去のオフィスアワーで、3Dガウシアン・スプラフティングやNeRFを独自技術化し、3Dシーンを生成することを目指していると明らかにしているそうです。これはどちらも2D画像や動画から3D空間を作り出す「ボリューメトリック」と呼ばれる技術です。
つまり、Midjouneryに作ってほしい世界をプロンプトで指示すると、画像ではなく、60fpsで動作し、内部を自由に動き回れる3Dシーン全体が生成される未来が来ると、ホルツ氏は考えているわけです。もし1秒間に60枚も生成できるようになれば、それはゲーム機などで表示されている速度と変わらなくなります。
現在はまだ生成する画像に連続性や一貫性をもたせることは簡単ではありませんが、それを実現するための研究も次々に登場してきています。もし特定の空間をテーマに画像を生成し続けられるとすれば、それらを処理することで3D化を実現することも原理的には可能です。そこに移動やイベントの概念が入ってくれば、もうUnreal EngineやUnityなどのゲームエンジンと呼ばれているものと変わらなくなってきます。
画像生成AIがゲームエンジン化していくというアイデアは、予想としては昨年からすでにありました。しかし、実際に有力な画像生成AIサービスを運用する企業のトップがここまで踏み込んだ発言をしたというのが新しい点です。しかも年末までには実現するということですから、どうやろうとしているのかに興味がわきますね。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります