LTX Videoは、高品質な動画を生成可能なDiTベースの動画生成モデルです。このモデルは、768×512の解像度で24FPSの動画を高速に生成でき、テキストからの動画生成および画像+テキストからの動画生成の両方に対応しています。
実行環境
ローカルでの動画生成には非常に高いPCスペックが求められますが、LTX Videoは比較的軽量でRTX 3060 12GBでも問題なく生成が可能です。
OS | Windows11 24H2 |
ComfyUI | f18ebbd31645437afaa9738fcf2b5ed8b48cb021 (v0.3.9) |
グラフィックボード | NVIDIA GeForce RTX 3060 12GB |
モデルのダウンロード
以下のリンクからモデルをダウンロードして配置してください。
📁ComfyUI\models\checkpoints\ltx-video-2b-v0.9.1.safetensors
📁ComfyUI\models\text_encoders\t5xxl_fp16.safetensors
Text to Video
テキストに基づいて、シーンやアクション、キャラクターの動きなどを含む動画を生成します。
プロンプト記入のポイント
- 長く詳細なプロンプトが必要で、短すぎると品質が大きく低下する。
- プロンプトは、主要なアクションから始め、動きやジェスチャー、外見を具体的に描写する。
- 背景や環境の詳細、カメラアングルや動き、照明や色も含め、視覚的なイメージを明確にする。
上の画像にワークフローが埋め込まれてるのでドロップして使ってください。
Prompt: A woman with long brown hair and light skin smiles at another woman with long blonde hair. The woman with brown hair wears a black jacket and has a small, barely noticeable mole on her right cheek. The camera angle is a close-up, focused on the woman with brown hair’s face. The lighting is warm and natural, likely from the setting sun, casting a soft glow on the scene. The scene appears to be real-life footage.
Image to Video
入力画像に、テキストに基づいたシーンやアクション、キャラクターの動きなどを加えた動画を生成します。
上の画像にワークフローが埋め込まれてるのでドロップして使ってください。
Prompt: The waves crash against the jagged rocks of the shoreline, sending spray high into the air.The rocks are a dark gray color, with sharp edges and deep crevices. The water is a clear blue-green, with white foam where the waves break against the rocks. The sky is a light gray, with a few white clouds dotting the horizon.