最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較
指とテキスト
初期の画像生成AIは「手」を描くのを苦手としていた。6本指や4本指を見かけてギョッとしたことがある人も多いだろう。また、画像内に指定した「文字」を書かせることも得意ではなかった。
ここではその2つの要素を含んだ意地悪なプロンプトを試してみよう。
プロンプト: A hand holding a small business card reading "ASCII.jp" (「ASCII.jp」と書かれた小さな名刺を持つ手)
1.1 [pro]で生成したものは指の破綻もなく、きちんと名刺をつまんでいるように見える。
1 [pro]の方も指は合格。ちょっと名刺が小さすぎる気もするが「a small business card」というプロンプトを忠実に守っているとも言える。
Midjourneyも明るくていい構図だが、見ようによっては6本指に見える画像になってしまっている。
DALL-E 3は完全に6本指になってしまった。名刺に「Ascii.jp」以外の文字が入っているのは少しおもしろい。
Imagen 3はデザインされたおしゃれな名刺になっている。ただし「ASCII」の綴が……。惜しい。
Stable Image Ultraも指がおかしいうえに、「ASCI.JP」だ。
以上、Flux以外はまだ指が怪しいことが多い。個人的な優勝は1.1 [pro]ではなく1 [pro]で。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります