週刊アスキー

  • Facebookアイコン
  • Xアイコン
  • RSSフィード

【解説】Geminiの画像生成がすごい 無料で使えるうちに試してみて

2025年03月21日 17時00分更新

高精度テキストレンダリング

 Gemini 2.0 Flash Experimentalでは、従来の画像生成AIが苦手としていた文字描画の精度が大幅に向上しているとされている。確かに英語テキストに関しては、長文でも崩れにくく、フォントの一貫性も維持されるようになった点は大きな進歩だ。

グーグルのデモ画像

 しかし、日本語を含む非ラテン文字のレンダリングについては、まだ改善の余地が大きい。漢字やひらがな、カタカナが混在する日本語テキストは依然として崩れやすく、特に長文になるほど不正確になる傾向が見られる。また、英語と日本語のように複数言語を混在させたテキストは特に苦手としており、言語の切り替わり部分でレイアウトが乱れることが多い。

日本語はなかなか厳しい

 とはいえ、プロンプトの工夫次第ではある程度まで改善できる可能性もある。例えば「フォントは明朝体で」「テキストを大きく中央に配置」といった具体的な指示を加えることで精度は向上する。また、チャット形式での段階的な修正も有効だ。一度生成した画像に対して「このテキストをもっと読みやすくして」「文字のサイズを大きくして」といった指示を重ねることで、徐々に質を高めていけるのはうれしい。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
S