年末になり、画像生成AI技術を応用した、動画生成の研究やサービスが次々に発表になりました。しかし、企業が研究に関わったものは、その多くはコアとなるコードやデータ部分が公開されない傾向が増えつつあります。Stable DiffusionのStability AIも、ついに商用利用の有償化に踏み切りました。一因は開発コストと収益とのバランスにありそうです。
動画生成で話題になった「MagicAnimate」と「AnimateZero」
動画生成技術として大きく話題になったのは、1枚の画像とモーションシーケンスを用意すれば自然なダンスのような動画を作れる「Magic Animate」ですね。
1枚の画像からキャラクターの一貫性を維持した動画を作れるということで、大きな革新と言えます。シンガポール国立大学とTikTokを運営するバイトダンスが研究した技術で、デモの実行環境が公開されています。デモ環境はローカルでも構築可能。コアの技術を使うにはかなりテクニックが必要なのですが、現在はアンオフィシャルな形で動作させる方法の探求も進められています。
また、画像生成AIの動画への応用技術「AnimateDiff」を土台にした新技術も次々に出ています。
そのひとつが「AnimateZero」。AnimateDiffの手法を発展させた方法で、画像を入れるとAnimateDiff以上に安定することを売りにしています。デモを見るとその安定性はかなり高い性能に見えます。北京大学とテンセントによる共同研究なのですが、これはコードが未公開なのでどれくらいできるのかよくわからない状態です。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります