動画生成AIの時代が来てしまいました。テキストから動画が作れる「Stable Video Diffusion」公開

2023年11月22日 13時30分更新

　Stability AIは11月21日（現地時間）、同社の生成画像モデル「Stable Diffusion」をベースにした生成動画用の最初の基礎モデル「Stable Video Diffusion」を研究プレビュー用途で公開した。

テキストから動画を生成

　Stable Video Diffusionは、毎秒3～30の可変フレームレートで動く14フレームおよび25フレームの動画を生成できる2つのモデルで構成されており、3フレーム／秒で単純計算すると最長8秒強の動画が生成できることになる。

　公開されたデモ動画を見ると「Ice dragon in the mountains（山の上のアイスドラゴン）」「Astronaut walking on the moon（月面を歩く宇宙飛行士）」「Two Blue Jays on the top of a building（建物の屋上に2匹の青カケス）」といった自然言語から数秒の動画が見事生成されているのがわかる。