画像生成AI(Stable Diffusion)のプロンプトを作成
画像生成AIは、今もっともホットなAIの分野と言える。実際ChatGPT PlusとBingチャットではOpenAIの画像生成AI「DALL-E3」を使って自由に画像を生成できるようになっている。他のチャットボットでも実装される可能性はあるだろう。
今回は、DALL-E3、Midjourneyと並んで代表的な画像生成AI「Stable Diffusion」用のプロンプト(画像生成AI界隈では「呪文」と呼ばれることも)を生成してもらい、実際にStable Diffusionを使って画像を生成できるサービス「DreamStudio」で描画してみた。
「SDXLで『思ったより高額な請求書を見て困り果てている日本人のお姉さん』を描くプロンプトを英語で書いてください」という指示を与えてみる。
●解答例
●評価
・ChatGPT:プロンプトに沿ってはいるが、少しクオリティが低いかな。
・ChatGPT Plus:平文ではなく構造化されたコードの形で生成してくれたが、そのままプロンプトとして突っ込んだら無事希望通りの画像が生成された。ちょっと時代錯誤ではあるが画像の品質はいちばんいい。
・Bard:回答拒否。
・Claude:多少顔が崩れてはいるものの、いちばんイメージに近い画像が生成された。これをベースに改良していけばいいだろう。
なお、ここで生成されたプロンプトをStable DiffusionではなくMidjourneyやDALL-E3(ChatGPT Plus)に入力しても問題なく動作した。
●採点
ChatGPT | ChatGPT Plus | Bard | Claude |
---|---|---|---|
6 | 10 | 0 | 10 |
コーディング
プログラムコードはLLMの得意とする分野と言われている。ここでは西暦を和暦に変換する簡単なプログラムを作成してもらうことにした。プログラムの品質よりも、実際に初心者がこれを見て利用できるかどうか、どのようなプログラム言語を使っているかなどを評価基準としたい。
●解答例
●評価
・ChatGPT:Pythonのコードが提示された。「PyWeb」や「Google Colab」などなんらかの実行環境がないと動作しないためプログラム初心者には少し厳しいかも。
・ChatGPT Plus:フレームワーク「Flusk」を使ったPythonのコードとJavascriptとHTMLで書かれたコードで構成されており、実行手順もわかりやすく示されている。ある程度経験がある人ならこれがベストだろう。
・Bard:HTMLとJavascriptのみで構成されたコード。初心者にはこれがいちばん使いやすいだろう。
・Claude:ChatGPT Plusと構造は似ているが、Fluskのインストール手順などは示されておらず、追加質問が必要だろう。
●採点
ChatGPT | ChatGPT Plus | Bard | Claude |
---|---|---|---|
6 | 10 | 10 | 6 |
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります