LTX-Videoを使ったテキスト&画像からの動画生成

AIツール

LTX Videoは、高品質な動画を生成可能なDiTベースの動画生成モデルです。このモデルは、768×512の解像度で24FPSの動画を高速に生成でき、テキストからの動画生成および画像+テキストからの動画生成の両方に対応しています。

実行環境

ローカルでの動画生成には非常に高いPCスペックが求められますが、LTX Videoは比較的軽量でRTX 3060 12GBでも問題なく生成が可能です。

OSWindows11 24H2
ComfyUIf18ebbd31645437afaa9738fcf2b5ed8b48cb021 (v0.3.9)
グラフィックボードNVIDIA GeForce RTX 3060 12GB

モデルのダウンロード

以下のリンクからモデルをダウンロードして配置してください。

📁ComfyUI\models\checkpoints\ltx-video-2b-v0.9.1.safetensors

📁ComfyUI\models\text_encoders\t5xxl_fp16.safetensors

Text to Video

テキストに基づいて、シーンやアクション、キャラクターの動きなどを含む動画を生成します。

プロンプト記入のポイント

  • 長く詳細なプロンプトが必要で、短すぎると品質が大きく低下する。
  • プロンプトは、主要なアクションから始め、動きやジェスチャー、外見を具体的に描写する。
  • 背景や環境の詳細、カメラアングルや動き、照明や色も含め、視覚的なイメージを明確にする。

上の画像にワークフローが埋め込まれてるのでドロップして使ってください。

Prompt: A woman with long brown hair and light skin smiles at another woman with long blonde hair. The woman with brown hair wears a black jacket and has a small, barely noticeable mole on her right cheek. The camera angle is a close-up, focused on the woman with brown hair’s face. The lighting is warm and natural, likely from the setting sun, casting a soft glow on the scene. The scene appears to be real-life footage.

Image to Video

入力画像に、テキストに基づいたシーンやアクション、キャラクターの動きなどを加えた動画を生成します。

上の画像にワークフローが埋め込まれてるのでドロップして使ってください。

Prompt: The waves crash against the jagged rocks of the shoreline, sending spray high into the air.The rocks are a dark gray color, with sharp edges and deep crevices. The water is a clear blue-green, with white foam where the waves break against the rocks. The sky is a light gray, with a few white clouds dotting the horizon.

入力画像
タイトルとURLをコピーしました