Stable Diffusionで画像からプロンプト(呪文)を生成・抽出する方法。Fooocusの新機能「Describe」が便利でした
【おまけ】ChatGPTを組み合わせてみる
最後に、同じ画像をChatGPTにアップロードして、プロンプトを考えてもらった(GPT-4V)。
A digital artwork of a graceful woman with a serene smile, standing at the bottom of a sunlit traditional stone staircase, surrounded by lush greenery. She has long, flowing black hair, fox-like ears, and bright red eyes. She wears a traditional white kimono adorned with a pattern of vibrant red flowers and a red obi belt. The scene suggests a tranquil Japanese garden, with bamboo and blooming flowers on a bright day
結果、こちらもかなり長大なプロンプトが生成された。アニメ絵だけ異様に力が入っている。生成AI界隈あるあるである。
FooocusにChatGPTが作成したプロンプトをコピペし、生成されたイラストがこちら。
和風というより中華風になっていたり、ケモミミが狐として分離していたりとかなり異なるが、イラスト自体のクオリティーはなかなかのものだ。
というか、ChatGPTって「DALL·E 3」(画像生成AI)使えるんだった……ということで、生成してもらった画像がこちら。
グハ! かなりツボな美少女が生成された。今年はStable DiffusionだけではなくDALL·Eの探求もしなきゃなあ……と新たな課題が増えてしまった。
田口和裕(たぐちかずひろ)
1969年生まれ。ウェブサイト制作会社から2003年に独立。雑誌、書籍、ウェブサイト等を中心に、ソーシャルメディア、クラウドサービス、スマートフォンなどのコンシューマー向け記事や、企業向けアプリケーションの導入事例といったエンタープライズ系記事など、IT全般を対象に幅広く執筆。2019年にはタイのチェンマイに本格移住。
新刊:2月20日発売「生成AI推し技大全 ChatGPT+主要AI 活用アイデア100選」https://amzn.to/3HlrZWa
週刊アスキーの最新情報を購読しよう