欲しい映像素材が簡単に作れる! グーグル動画生成AI「Veo 3.1」の使い方
2026年01月30日 09時00分更新
プロンプトは「仕様」ではなく「場面」を書く
Veo 3.1では、解像度やフレームレートといった技術的な数値を詰めても、結果が思いどおりに安定するとは限らない。短尺素材前提の設計から考えると、モデルが理解しやすいのはどんな場面かという文脈だ。
プロンプトは仕様書というより、演出メモとして書いたほうがうまくいく。場所、時間帯、天候、人の動き、周囲の音。短いワンシーンとして成立する情報を揃えことが重要だ。
横動画:演出メモとして書く
以下は、ドラマのワンシーンを想定した横動画向けのプロンプト例だ。
プロンプト:夕方の街角、オレンジ色の光が建物の壁に当たっている。人通りは少なく、遠くで車の走行音が聞こえる。歩道を一人の女性がゆっくり歩いていく。コートを着て、視線は前方。カメラは固定、やや引きの構図。落ち着いた雰囲気。
— tagkaz_ascii (@tagkaz_ascii) January 26, 2026
ポイントは、技術指定ではなく「その場にいたら何が見えて、何が聞こえるか」を書くことだ。カメラの動きも「パン」「ズーム」といった用語より、「固定」「引き」のように結果の状態で伝えたほうが安定しやすい。
縦動画:指定しても安定しない
縦動画を狙う場合、「縦動画で」「スマートフォン向け」とプロンプトに書いても、横構図になるケースが少なくない。Geminiの画面では縦横比を直接指定する項目がなく、縦構図は明示的に固定できる仕様ではないためだ。
そのため、プロンプトでの縦指定は、縦動画を保証する指示というより、構図を縦寄りに誘導するためのヒントとして扱われていると考えると理解しやすい。実際の生成結果では、指定しても横構図として解釈されることがある。
プロンプト例:スマートフォンで見る縦動画。カフェのカウンター席。ラテアートが置かれる瞬間を手元のアップで捉える。湯気が立ち上り、カップ表面にハート模様が見える。店内のBGMと、カップを置く小さな音。
— tagkaz_ascii (@tagkaz_ascii) January 26, 2026
縦構図を誘導する場合は、被写体を「手元」「顔のアップ」「カップのクローズアップ」など縦に収まりやすいものに絞り、画角も「上から」「胸から上」「テーブル上だけ」といった狭めの指定に寄せるほうが破綻しにくい。逆に、人物の全身や横に広がる背景を前提にすると、横構図に寄りやすい傾向がある。
どうしても縦構図を確実にしたい場合は、縦構図の参照画像を併用するか、縦横比を指定できる入口(APIなど)を使うほうが確実だ。Gemini上での利用では、縦動画は指定するものではなく、結果として現れるかどうかを見るものと捉えておくのが現実的だ。
※補足:Google AI Studioでは、生成時に縦横比を指定できる項目が用意されている。ただし利用にはAPIキーが必要で、Geminiのチャット画面とは入口や前提が異なる。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります
