「ファンタジー小説のシーン」を描いてもらう
「未来都市」を見る限り、正直わざわざGPTを使わなくても自分でプロンプトを考えて試行錯誤すればいいのではと思ってしまったが、次のサンプルプロンプトを入れてびっくり。
プロンプト:Illustrate a scene from a fantasy novel.
「ファンタジー小説のワンシーンをイラストに」というプロンプトを入れただけなのに、出てきたものはこれ。
なんと、元のプロンプトをベースに長文のプロンプトを提案してくれたのだ。
プロンプト:Picture this: a secret, moonlit glade hidden deep within an ancient, whispering forest. In the center of the glade, a crystal-clear spring bubbles, its waters glowing softly with an ethereal light. Surrounding the spring are rare, luminous flowers, their petals shimmering in shades of otherworldly blues and purples. Above, the moon casts a silver glow through the canopy, dappling the scene with light and shadow. In the foreground, a young wizard, clad in a cloak of deep midnight blue, stands with a spellbook open in one hand, while the other hand is raised, fingers weaving a spell that sends ripples of magic through the air. Beside the wizard, a majestic, silver-furred wolf watches, its eyes glowing with a gentle, inner light. In the background, ethereal spirits, barely visible, dance around the edges of the glade, their forms flickering between visibility and invisibility. (想像してみてください:古代の囁く森の奥深くに隠された秘密の月明かりの小さな林間の空地。その空地の中心には、クリスタルのように透明な泉が泡立ち、その水は霊的な光でそっと輝いています。泉の周りには珍しい、発光する花があり、その花びらはこの世のものとは思えない青や紫の色できらめいています。上では、月が銀色の輝きを投げかけ、光と影で場面を斑点模様にしています。 手前には、深夜の青色のマントを身にまとった若い魔法使いが立っており、一方の手で魔法の本を開きながら、もう一方の手は魔法の波紋を空気中に送る呪文を編み出すために挙げられています。魔法使いの横には、威厳のある銀色の毛皮を持つ狼が見守っており、その目は優しい内なる光で輝いています。背景では、霊的な精霊たちが空地の端を踊り回っており、その姿は見えたり見えなかったりします。)
そもそもDALL·Eは長いプロンプトほどいい感じの絵が出るという傾向があるが、さすがにこの長さのプロンプトを考えるのは大変なので、これはかなり便利かも。
上記のプロンプトで生成された画像。先程の未来都市と比べてかなり出来が良くなっているように感じる。
では、この長大なプロンプトを「DALL·E」に伝えたらどうなるのだろうか。
位置関係などは異なるが、描かれたオブジェクトの種類など、かなり「image generator」と類似した画像が生成された。
だが、なぜ2個目の例だけ「image generator」は長大なプロンプトを用意してくれたのだろうか?
プロンプト:Illustrate a photorealistic, gleaming future city with an Asian aesthetic.
もしかしたら「illustrate」という単語が鍵かと思い、新たに上記のプロンプトを入れてみた。
しかしこちらはプロンプトを膨らませてもらえなかった。発動条件がわからない。そもそもDALL·Eは内部的にGPTを使ってプロンプトを長くしているという話しもあり、どこまで効果があるのかは不明だ。
プロンプトはGPTに考えてもらうのが吉
とはいえ、ここまでの結果から長いプロンプトの方が精細な絵を出力する傾向があるのは確か。そこで今度は長大なプロンプトをChatGPTに考えてもらう方針で試してみることにした。
プロンプト:「100年後の未来に流行している球技」をDALL·Eに描かせたいので、英語で状況を適切に説明した詳しいプロンプトを考えてください。
そこで、このようなプロンプトをChatGPT(GPT-4)に投げてみると。
このように膨大な設定を盛り込んだ長いプロンプトを作成してくれた。
プロンプト:Imagine a futuristic sport that has captivated the world 100 years from now. This game, known as "Quantum Ball," combines advanced technology with traditional ball game elements, creating a unique and thrilling spectator experience. Played on a floating arena that dynamically changes shape and elevation, the game involves two teams of players equipped with gravity-defying suits and holographic visors. The objective is to score points by getting a glowing, energy-infused ball into the opposing team's shifting goal, which can appear anywhere in the arena. Players use a combination of strategy, agility, and high-tech gadgets, such as teleportation pads and energy shields, to outmaneuver their opponents. The arena is surrounded by holographic displays showing real-time stats, instant replays, and player information, while drones capture every angle of the action for viewers watching from home. The game reflects a future where technology enhances human abilities and sports evolve into more immersive experiences. (想像してみてください:100年後の未来、世界を魅了している未来的なスポーツがあります。このゲームは「クォンタムボール」として知られており、先進技術と伝統的な球技の要素を組み合わせ、独特でスリリングな観戦体験を生み出しています。動的に形と高さが変わる浮遊アリーナで行われるこのゲームは、重力を無視するスーツとホログラフィックバイザーを装備した2チームのプレイヤーが参加します。目標は、輝くエネルギーを帯びたボールを相手チームの変動するゴールに入れることで得点を挙げることです。このゴールはアリーナのどこにでも現れることがあります。プレイヤーは戦略、敏捷性、およびテレポーテーションパッドやエネルギーシールドのようなハイテクガジェットの組み合わせを使用して、相手を出し抜きます。アリーナはホログラフィックディスプレイで囲まれており、リアルタイムの統計、インスタントリプレイ、プレイヤー情報を表示し、ドローンが行動のすべての角度を捉えて家で見ている視聴者に伝えます。このゲームは、技術が人間の能力を高め、スポーツがより没入型の体験へと進化する未来を反映しています。)
このプロンプトをそれぞれのGPTに食わせてみよう。
どちらも可能な限り設定を盛り込んだ密度モリモリの画像を生成してくれた。うん、この方法がいいかも。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります