週刊アスキー

  • Facebookアイコン
  • Xアイコン
  • RSSフィード

4コマ漫画もリアルな画像も簡単生成! 凄すぎるGPT-4oイメージ生成をさっそく使ってみた

2025年03月27日 17時00分更新

 3月25日、ChatGPTとSoraにネイティブな画像生成機能が追加された。マルチモーダルAIモデルであるGPT-4oのイメージ生成機能で、従来のDALL-Eよりも格段に柔軟な指示が行えるのが特徴。これまで画像生成AIが苦手だった文字を扱うこともできるようになっている。

 複数コマのマンガや文字が入った広告など、アイディア次第で驚くほどクオリティの高い画像を生成できる。今回は、色々な画像の作り方を紹介しよう。

苦手だった画像内の文字も扱える、ChatGPTの画像生成機能

 まずは、OpenAIのウェブサイトで公開されていたホワイトボードに文字を書いている女性のプロンプトを日本語にしていじってみた。

■ベイブリッジを見下ろす部屋にあるガラスのホワイトボードを携帯電話で撮影した広角の横長画像。視野には、大きな 柴犬のロゴの入ったTシャツを着た女性がホワイトボードに向いて書き物をしている様子が写っています。手書きは自然で少し乱雑に見え、撮影者の姿が映っています。

テキストには次のように書かれています:

(左)
柴犬の可愛いポイント

利点:
・表情が豊か
・サイズがちょうどいい
・飼い主に忠実
・きれい好き
・番犬になる

(右)
欠点:
・マイペース
・社会性がない
・毛が大量に抜ける
・甘え下手

(右)の下に柴犬の手描きイラスト


 日本語が少し崩れているところもあるが、概ね表現できていた。ホワイトボードの映り込みがちょっと強かったので、少し弱めるようにプロンプトを入力すると、元の画像を引き継ぎつつ再生成してくれる。チャットで画像の修正を指示できるのは非常に便利だ。生成AIチャットボットの真骨頂と言える。

映り込みを抑えた画像が生成された

 続けて、「ホワイトボードに映りこんでいる撮影者と女性がハイタッチをしている写真」と入力してみると、その通りの画像が生成される。撮影者の服装や表情なども、チャットで指示してどんどんブラッシュアップできる。

撮影者も登場

 さらには、筆者の写真をアップロードし、「写真の人物と女性がハイタッチしている写真にしてください」と指示してみる。すると、生成は可能だが、本人の許可を取っているかと確認された。「この人物に似た雰囲気の男性のイメージを新しく生成するか」という選択肢も提示されているのが凄い。

自分の写真をアップロードして男性と入れ替える指示をした

アップロードした人物が写真内に登場した

元画像を保持しながらバリエーションを生成する

 OpenAIのウェブサイトでは、猫の画像に片眼鏡をかける例が載っていたので、柴犬画像で試してみた。桜の花も映っているので、これも梅の花に変換できるのか試したところ、なかなかのクオリティでレタッチしてくれた。ただ、画像生成AI全般、柴犬のデータは豊富にあるのだが、黒柴犬は少ないらしく、うまく生成できないことが多い。今回も、白い部分が茶色くなってしまった。

桜を梅に変え、柴犬に眼鏡をかけさせた


 レイアウトを手書きで指示することもできる。例えば、広告バナーを作成する際、従来は画像を生成してから、別ソフトでデザインしていたが、4oイメージ生成なら、ChatGPT内で完成するのだ。

 画像をアップロードし、プロンプトを入力すると、デザイン案を出してくるので、「はい」と答えると生成が始まる。初回は少し想定とアスペクト比が違ったので、指示するとすぐに再生成してくれた。

手描きのレイアウトを撮影して読み込ませる

■プロンプト
画像を参考にして、広告画像を作成します。背景画像では、日本人女性が柴犬と遊んでいます。

バナーに入れるテキストは以下の通り
#1メインタイトル
 柴犬フェスティバル2025
#2サブタイトル
 広いドッグランで気持ちよく走り回ろう!
#3日時
 5/1(木)
 10:00~
#4場所
 ゆりの木公園

4コマ漫画もサクッと生成でき、イラストの視点も変更できる

 複数のオブジェクトを1枚の画像に並べて生成することもできる。アイコンだけでなく、イラストを並べることも可能。それぞれのポーズをしっかりと指示すると望む画像が得られやすい。「芝ドリル」がAIに通じるか試してみたが、すんなりと描いてくれた。凄い。

■プロンプト
白い背景に3行3列のグリッドと9個のオブジェクトを含む正方形の画像。モチーフはデフォルメされた柴犬のキャラクター。順番は左から右、上から下へ、ポーズリストは次のとおり。

1. お座りしている
2. 寝転んでいる
3. 寝ている
4. 笑っている
5. 吠えている
6. 芝ドリルしている
7. 骨をかじっている
8. 地面を掘っている
9. お手をしている


 漫画も描ける。まずは、シンプルに4コマ漫画を生成してもらった。朝からお母さんが忙しくしている中、夜中に酔ったお父さんが帰ってきて怒られた、という内容にしてみた。

 文字はやはりちょっと変だが、漫画としては普通に描けているのではないだろうか。テキストは別アプリで入れる必要があるものの、社内報や本日のメニュー、店内に掲示するポスターなどに載せる4コマ漫画くらいならサクッと作れそうだ。

■プロンプト
4コマ漫画を描いてください。
タイトル:逆鱗に触れるお父さん

漫画の内容は以下のとおり。
1コマ目:お母さんが忙しそうに朝から料理をしている。
2コマ目:お母さんが自転車に乗り、子どもを後ろに乗せている。セリフ「遅れるー」
3コマ目:お母さんが疲れながら洗濯物を干している。セリフ「疲れた…」
4コマ目:夜、酔って顔を赤くしたお父さんが帰ってくる。お母さんが激怒して、セリフ「遅い!」


 冒頭の例で、撮影者を画面内に出したが、もっとダイナミックに視点を変えることもできるのだ。まずは、昭和の子供部屋を生成してもらい、その後、俯瞰するように指示すると、見事上からの視点で描き直してくれた。

 ベッドやテレビをはじめ、人形などの小物の位置もきちんと引き継がれており、流石だ。文字はビフォーもアフターも変なのでそこは何とかしてほしいところ。

画像の視点を変更できる


 文字の入ったロゴを生成できるので、SNSや社内ポータルで使うアイコンを生成するのに使えそうだ。部署や氏名を入れて、わかりやすくしておくといいだろう。もちろん、凝った指示を出せば、企業ロゴなども生成できる。

■プロンプト
円形のロゴ画像を生成してください。文字は「総務部」で配色は黄緑系にしてください。


 以上が、4コマ漫画もビジネスクオリティの画像素材も簡単に作れる4oイメージ生成の使い方となる。まだまだアイディア次第で色々な画像を生成できそうなので楽しみだ。

■関連サイト

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

S