Black Forest LabsがリリースしたText to ImageのFLUX.1は、ベンチマーク(ELOスコア)で他の主要モデルよりも上回っています。今回ComfyUIのアップデートでFLUXがサポートされローカルでも簡単に試すことができるようになりました。
実行環境
FP8のチェックポイントでも最低VRAM12GB以上とメモリ32GBが必要だと思います。チェックポイントも20GB程度のファイル容量があるのでストレージの空きも注意してください。
OS | Windows11 23H2 |
ComfyUI | v0.0.4 (b334605a6631c12bbe7b3aff6d77526f47acdf42) |
グラフィックボード | NVIDIA GeForce RTX3060 12GB |
メモリ | 48GB |
まずComfyUIがv0.2.0より前の場合はアップデートしてください。
モデルのダウンロードとワークフロー
これから紹介する2つのモデルはそれぞれライセンスが違うので気を付けてください。
FLUX.1 dev
非商用ライセンスになります。こちらからダウンロードしてください。
上の画像をドロップしてワークフローを使ってください。CFG1, ネガティブプロンプトは不要
今回の私の実行環境だと1step7秒ほど、1枚生成するのに2分近くかかりました。モデルロード時は大量のメモリを消費し生成時のVRAMもギリギリでした。
FLUX.1 schnell
Apache License 2.0になります。こちらからダウンロードしてください。4stepの高速なモデルになります。
上の画像をドロップしてワークフローを使ってください。CFG1, ネガティブプロンプトは不要
4ステップでもかなり高品質な画像を生成することができました。また、指の数や文字の表現など破綻の多いプロンプトを試しましたがそこまで失敗することなく生成できました。SDXLと比べてこれはすごい!ぜひお試しください。