複数主題のプロンプト、画質、スペリング能力におけるパフォーマンスが向上したStable Diffusion 3を試してみました。今までAPIでの提供だったがローカルでも利用できるようになったので利用方法を紹介します。
実行環境
6月13日現在、ComfyUIが対応しています。AUTOMATIC1111も後に対応するとは思います。
OS | Windows11 23H2 |
ComfyUI | 605e64f6d3da44235498bf9103d7aab1c95ef211 |
ComfyUIアップデート
Stable Diffusion 3を利用するにはComfyUIを最新にアップデートする必要があります。ComfyUI_windows_portable\update\update_comfyui_and_python_dependencies.batを実行してださい。
途中、続行するには何かキーを押してください . . .となるのでキーを押してインストールを続けてください。
Stable Diffusion 3モデルのダウンロード
ライセンスのアップデートありました。
ライセンスの修正
SD3に元々関連していた商用ライセンスがコミュニティに混乱や懸念を引き起こしたことを認識しているため、個人のクリエイターや小規模事業者向けにライセンスを修正しました。この新しい「Stability AIコミュニティライセンス」の下でリリースされたモデルは、以前のライセンスよりもはるかに広く無料で使用できます。これには最近の Stability AI モデルである SD3 Medium が含まれます。以下は私たちの目的です。
https://ja.stability.ai/blog/license-update
- 非商用利用は無料のまま: Stability AI モデルを自分のデバイスにインストールして(直接またはそれを含む無料のオープンソースパッケージをインストールして)非商用利用を行う人や組織は、引き続き無料で使用できます。これは、ほとんどのコミュニティに適用されます。例えば、無料で研究を発表する研究者、無料のオープンソース開発者、フルタイムの学生、教師、趣味としてご利用の方、モデルを改善して配布する「ファインチューナー」などです。
- 個人利用や小規模事業者向けの無料商用利用: 個人や小規模事業者が「Stability AIコミュニティライセンス」の下で Stability AI のモデルを使用し、派生製品を作成する(例えば、Stable Diffusion 3 のファインチューニング)または製品やサービスにモデルを統合する場合、年間収益が100万米ドル(または現地通貨相当額)を超えない限り無料です。
- 少ない利用制限: Stability AI コミュニティライセンス契約の下で作成できるメディアファイル(例えば、画像、ビデオなど)の数に制限はありません。このライセンスが適用される場合、違法な活動やライセンスや AUP に明確に違反しない限り、たとえStability AIに支払わない場合でも、Stability AIは結果として生じる画像、ファインチューニングやその他の派生製品を削除するように要求することはありません
- 商用ユーザーのみ自己報告が必要: Stability AI のモデルまたは派生製品を自社の商用製品やサービスに統合し、年間収益が100万米ドル未満の場合、Stability AI に支払う必要はありません。ただし、このフォームに記入し、最も関心のあるモデルをお知らせください。年間収益が100万米ドルを超えた場合は、別途エンタープライズライセンスの取得のために Stability AI にご連絡ください。
以下からmediumモデルをダウンロードします。
Hugging Faceにログインして連絡先情報を入力してください。ライセンス規約に同意することでファイルにアクセスできます。
テキストエンコーダーの含まれている3つのモデルを利用してください。
ComfyUIのワークフロー
モデルをダウンロードしてフォルダに配置したらComfyUIを起動してください。
こちらの画像にワークフローが埋め込んであるのでComfyUIにドロップして使ってください。
個人的な感想ですが画質はSDXLとさほど変わらないような気はしますがテキストの表現力は上がっている気がします。まだベースモデルの利用なので今後チューニングされたモデルがどのような画像を生成できるか楽しみです。