Stable Video Diffusionのインストールと使い方

Stable Video Diffusionを簡単にインストールする方法と使い方、ComfyUIでの使用方法も紹介します。

Stable Video Diffusionとは
Stable Video Diffusionのインストール
Stable Video Diffusionの使い方
Stable Diffusion ComfyUIでの使い方

Stable Video Diffusionとは

Stable Video Diffusion サンプル — 少し圧縮してるので画質は低下しています

入力画像から解像度576×1024（縦x横）の短い動画を生成することができます。アイキャッチ画像で試してみましたが一貫性も保たれており比較的自然な動画になっています。

問題点としては構図の指定などができません。おかしなカメラワークになったり人物が正しく生成されなかったりすることもあるため生成ガチャを必要とします。また、画像生成よりも高いマシンスペックが要求されます。最低でも12GB (ComfyUIは8GB) 以上のVRAMを搭載したグラフィックボードが必要となるでしょう。

Stable Video Diffusionのインストール

今回はPinokioを使ってインストールしました。Stable Diffusion ComfyUIでの使い方も後述しているのでお好きな方を選んでください。

AIツールをローカルに簡単にインストールできるPinokioの使い方

AIツールのインストールで面倒な環境構築やインストール作業をワンクリックで行うことができるソフト (Pinokio) を紹介します。

また、Stable Diffusion WebUI Forgeでも利用できます。

Stable Diffusion WebUI ForgeとAUTOMATIC1111での画像生成の比較と拡張機能について

Stable Diffusion WebUI AUTOMATIC1111をベースに最適化したForgeをインストールしてリソースや推論速度の比較をしました。拡張機能についても少し触れているのでご覧ください。

Stable Video Diffusionの使い方

Model Versionをクリックしてモデルを選択します。SVDは14フレーム、SVD XTは25フレームを生成するように調整されています。

モデルを選択したらLoad Modelにチェックを入れてください。モデルのファイル容量は10GB程あるためダウンロードに時間がかかる場合があります。

パラメータがたくさんありますがInputに画像をアップロードしてSampleをクリックすれば生成が始まります。パラメータではfps（SVD14フレームのfps6なので約2.5秒の動画になる）motion bucket id（値を増やすと動きが大きくなり値を減らすと動きが少なくなる）Save path（保存先）などを確認すると良いでしょう。