第39回
画像生成AI「DALL·E 3」の性能が凄まじい。これを無料で使わせるマイクロソフトは本気で競合をつぶしに来ている
Stable Diffusionで「補完」も
さらに現在、DALL·E 3で完結させるのではなく、いろんな応用が出てきています。
たとえばDALL·E 3で作ったものをStable Diffusionに持っていき、サイズを変えて仕上げていく。髪の毛を追加したり、顔を修正したり、画面の迫力を増していく。また「水着」とか「谷間」といった性的な要素を含むプロンプトはブロックされるため、そういったプロンプトはローカル処理のStable Diffusion側で補っていくという例もあります。
DALL-E 3で生成した画像をStable diffusionとフォトショで加筆修正したもの。
— しろやぎ@AI画像クリエイター (@shiro_yagi_3) October 4, 2023
リプ欄に元画像貼って修正点解説します。
DALL-E 3がすごいのは完全同意なんですが、それでStable diffusionがオワコン化するかというと私はそうは思ってなくて。#AIart#Stablediffusion#DALLE3pic.twitter.com/PXj0E1AJwE
▲DALL·E 3にStable DiffusionとPhotoshopを組み合わせて、理想とする画像を生成している事例。こうした使われ方は広がっていくと考えられる
ちなみにDALL·E 3で生成した画像にはおそらくメタデータが入っていますが、Stable Diffusionに通して別のデータを作成した時点で、そのデータは消えることになると思います。メタデータを入れるのは管理者責任を明確にする要素もあります。クラウドサービスを運営している側としては、そこで生成されたコンテンツに対する管理者責任が問われやすいんですよね。アメリカ政府でもAI提供企業の責任についての議論が出ているので、性的なものや暴力的なものは禁止されていく方向にあります。一方、Stable Diffusionのようなローカルの画像生成AIは制限なく自由に生成できるけども、あくまでも生成したコンテンツを発信する個人の責任が重くなる……という形になっていくのでしょうね。
「DALL·E一強」ではなく、他のツールと住み分けか
DALL·E 3の登場は、業界にとってもインパクトが大きいですよね。Bingで無償提供ということも大きいですし、コンピューターの環境を気にせず利用できることで、クラウド化への移行も相当進むのではないかと思います。スマホでも簡単に使えるので、「ちょっと試してみたい」と思っている多くの人にとってはとてつもなくハードルが下がったのではないかと思います。特に有料でサービスを提供しているMidjourneyや、クラウド側をサービスの基盤にしつつあるStablityAIなどへの影響は大きいでしょう。また、ChatGPTがさらに強力になってしまうことは、出遅れているグーグルにしてみれば脅威だと思います。
ただし、これで「DALL·E 3一強」になるかと言うとそうとも言えません。たとえば、いまのところ画像から画像を直接生成する「image2image」の機能はありません。一枚画像として出てくるものは高精度ですが、狙った構図まで持っていくのはDALL·E 3だけだと無理があります。本格的に使うにはやはり他の生成AIやツールと組み合わせないと使い物にならない印象です。
マイクロソフトとOpenAIとの思惑には微妙に違いがあるとはいえ、両企業とも法的な状況を見ながら、慎重に機能を追加していくということなのでしょう。ユーザーベースを抱えていれば、後出しじゃんけんが効くところなので、特にマイクロソフトはまずは圧倒的なユーザー数を取りに来ているということだとと感じますね。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります