品質は“ガチャ” 実写は得意だが、アニメは苦手
私も境さんの方法をまねして、プロモーションビデオが作れないか試してみることにしました。3時間ほど格闘して、作成してみたのが1分ほどの動画です。
すべてのデータをMidjourneyとGen-2で生成している。音楽はAdobe Stockから購入。動画編集にはDaVinci Resolveを使用した(筆者作成)
作成した動画は4秒の動画を30種類組み合わせたもの。Gen-2で生成される動画のクオリティは、正直言って“ガチャ”でした。5種類くらいのパターンからランダムに生成されるんですが、期待した動画が出るかどうかは生成するまでわからないんですよね。いい動画が生成されるまで生成を繰り返すしかありません。印象としては、ハズレが多数出てきて、アタリもたまに出てくるという感覚です。
Gen-2が得意なのは、顔のアップや、波のような自然物のようです。おそらく奥行き(Depth)を推定し、簡単なボーンをつけ、どのように動かすのか決めているのではないでしょうか。それと学習データにもよるのでしょうが、実写的なものの方が適正に動画が出る可能性が高いようです。アニメ系の絵柄は得意ではなく、顔がつぶれてしまいがち。3Dアバター(VRMデータ)画像で試しましたが、別の顔になったりと、あまりうまく出ない傾向が高かったです。ただし冒頭に挙げた浮世絵風の絵のように、鑑賞に耐えうる動画が出ることもあるのであなどれません。
Gen-2は、アカウントを作成すると20回まではお試しで生成可能です。そこからは有料となり、月額15ドル(約2000円)のベーシックプランでは月50回生成できます。さらに10ドル追加で50回の生成が追加可能。動画の品質を上げようとしてある程度の量を求めると、50回はあっという間になくなってしまいます。実際、この動画を作るだけで使い切ってしまいました。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります