複数主題のプロンプト、画質、スペリング能力におけるパフォーマンスが向上したStable Diffusion 3を試してみました。今までAPIでの提供だったがローカルでも利用できるようになったので利用方法を紹介します。
実行環境
6月13日現在、ComfyUIが対応しています。AUTOMATIC1111も後に対応するとは思います。
OS | Windows11 23H2 |
ComfyUI | 605e64f6d3da44235498bf9103d7aab1c95ef211 |
ComfyUIアップデート
Stable Diffusion 3を利用するにはComfyUIを最新にアップデートする必要があります。ComfyUI_windows_portable\update\update_comfyui_and_python_dependencies.batを実行してださい。
![ComfyUIアップデート](https://pcniki.com/wp-content/uploads/2024/06/stable-diffusion-3-3-800x451.webp)
途中、続行するには何かキーを押してください . . .となるのでキーを押してインストールを続けてください。
Stable Diffusion 3モデルのダウンロード
mediumモデルが提供されており非商用なら無料で利用できます。
![ライセンス規約の同意](https://pcniki.com/wp-content/uploads/2024/06/stable-diffusion-3-1.webp)
Hugging Faceにログインして連絡先情報を入力してください。ライセンス規約に同意することでファイルにアクセスできます。
![Stable Diffusion 3 ファイル](https://pcniki.com/wp-content/uploads/2024/06/stable-diffusion-3-2-800x363.webp)
テキストエンコーダーの含まれている3つのモデルを利用してください。
ComfyUIのワークフロー
モデルをダウンロードしてフォルダに配置したらComfyUIを起動してください。
![Stable Diffusion 3 workflow](https://pcniki.com/wp-content/uploads/2024/06/stable-diffusion-3-4.png)
こちらの画像にワークフローが埋め込んであるのでComfyUIにドロップして使ってください。
個人的な感想ですが画質はSDXLとさほど変わらないような気はしますがテキストの表現力は上がっている気がします。まだベースモデルの利用なので今後チューニングされたモデルがどのような画像を生成できるか楽しみです。