【無料ローカルAI】音声付き動画を生成できる「LTX-2.3」ComfyUIでの使い方をわかりやすく解説!
2026年04月17日 17時00分更新
Lightricksは3月5日、動画と音声を単一のモデルで同時生成するオープンモデル「LTX-2.3」を公開した。これまで動画生成AIといえば、クラウドサービスの利用やハイエンドGPUの使用が前提とされることが多かったが、本モデルはその勢力図を塗り替える可能性を秘めている。
今回は、RTX 4070(VRAM 12GB)というミドルクラスの環境を用い、ComfyUIでどこまで実用的な生成が可能かを検証した。
LTX Studioで感触をつかむ
ComfyUIでローカル生成を試す前に、まずはブラウザ上で動作する「LTX Studio」で試してみよう。無料プランでも初回付与クレジットで数本の動画生成を試すことができるからだ。
これはLTX Studioの無料クレジットで生成した動画だ。プロンプトは「A person walking down an alley on a rainy night」というごくシンプルなものだ。
Web版の利点は、複雑な設定をしなくても「プロンプト一発で音が鳴る動画が出る」ことだ。LTX Studioは、LTX-2.3以外にもGoogleの「Veo 3.1」や「Nano Banana 2(Gemini 3.1 Flash Image)」、さらに「Kling 3.0」といった強力な最新モデルを選択肢に含む動画生成の統合プラットフォームへと進化している。
LTX-2.3というモデルを試す環境というよりは、タイムライン編集、プロ仕様のテキスト読み上げ(TTS)によるアフレコ、自動的なストーリーボード作成機能などを備えた「オールインワンの制作スタジオ」としての側面が強い。月額15ドルの「Lite」プランや無料枠も用意されており、プロ向けのツールとしては比較的手が届きやすい部類だ。
一方で、どれほど高機能であっても、クラウドサービスである以上は「クレジット消費」という心理的障壁と、企業側の「ガードレール(検閲)」からは逃れられない。
プロンプトの微調整を数百回繰り返したり、コーポレート・ポリシーに縛られない自由な表現を試してみたいなら、やはりComfyUIによるローカル運用が適している。
LTX Studioなどのサービスを「最新モデルの挙動を確認し、編集のテンプレートを練る場所」として活用し、「自由な表現と無限の試行錯誤」は手元のPCで納得いくまで試す。この使い分けが現時点のベストだと思う。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります


