Fooocusのインストールと機能の使い方

Stable diffusionのSDXLモデルを低いスペックのPCでも扱えるFooocusを紹介します。AUTOMATIC1111などと比べると設定項目は少なくシンプルで、Midjourneyを意識したような設計を取り入れています。またアップデートも自動で行われ、現在までに複数の機能が追加されてきました。

Fooocusのシステム要件

以下が主要環境のシステム要件になります。プラットフォームによって最小要件が異なるので注意してください。

OS	GPU	最小GPUメモリ	最小システムメモリ
Windows / Linux	Nvidia RTX 4XXX	4GB	8GB
Windows / Linux	Nvidia RTX 3XXX	4GB	8GB
Windows / Linux	Nvidia RTX 2XXX	4GB	8GB
Windows / Linux	Nvidia RTX 1XXX	8GB (6GBは不確実)	8GB
Windows / Linux	Nvidia RTX 9XX	8GB	8GB
Windows (DirectML)	AMD GPU	8GB	8GB
Linux (ROCm)	AMD GPU	8GB	8GB

実行環境

今回の実行環境は以下になります。

OS	Windows11 23H2
Fooocus	v2.5.2 (c2dc17e88341532bcb57b540c5f49ff25385c09a)

Fooocusのインストール

ダウンロード

下のリンクにアクセスしてください。

リポジトリ

GitHub – lllyasviel/Fooocus

スクロールしてDownloadのClick here to downloadをクリック

解凍

ダウンロードしたファイルは7zという形式で、現在のところWindows11の最新バージョンで解凍することができます。しかし標準機能では解凍速度が遅いため7Zipというソフトをおすすめします。

圧縮・解凍ソフト 7-Zip

起動

ダウンロードしたファイルを解凍してrun.batを実行（run_anime.batとrun_realistic.batは、それぞれに合わせたモデルやローラ・Styleなどが設定されますが、ブラウザでも直接プリセットの切り替えが可能）

ソフトウェアを初めて起動するとそれぞれのbatの設定に合わせたモデルが自動的にダウンロードされます。ファイル容量が大きいため時間がかかる場合があります。

準備が完了したら自動的にUIが立ち上がります。プロンプトを入力してGenerateをクリックすると画像が生成されoutputsフォルダ内に保存されます。

Advanced

Advancedにチェックを入れることで生成に関する設定ができます。

Setting

Preset（それぞれのモデルやスタイルがロードされます）
Performance (Sampling step数やその他設定などが変わります)
Aspect Ratios (width × height)
Image Number（生成枚数）
Output Format（保存形式）
Negative Prompt（ネガティブプロンプト）
Random（Seed値の設定）

Style

画風に影響するプロンプトのプリセットが用意されていて簡単に適用できます。

新しいテキスト処理エンジンのFooocus V2では、複数のスタイルをサポートし以前のバージョンよりも結果の向上が期待できます。

以下にStyle適用の例があります。どのようなプロンプトが適用されるかも確認できるのでチェックしてください。

Fooocus Style Reference

Model

モデルとローラの設定ができます。以下の階層に保存してください。

📁Fooocus\models\checkpoints

📁Fooocus\models\loras

CivitaiにSDXLベースのいろいろなモデルやローラが公開されています。フィルター機能もあるので簡単に検索することができます。

Civitai Models | Discover Free Stable Diffusion Models

Models – Hugging Face

モデルごとのライセンスの内容は、ダウンロードページで必ず確認してください。

Advanced

Guidance Scale（CFGスケール）
Image Sharpness（輪郭の強調）

Input Image

Input Imageでは入力画像にさまざまな調整を加えることができます。

Upscale

2倍までのアップスケールが可能ですが、通常の生成よりVRAMやメインメモリの消費が大きく要求スペックがあがります。

Upscaleの倍率を選択してください。Fastは高速に動作します。

Variation

入力画像のイメージは変えずに多少の変化をあたえます。

Vary (Subtle)は微妙な変化、Vary (Strong)は強い変化をあたえます。

Image Prompt

画像をプロンプト代わりに使って生成します。テキストプロンプトを入力してもうまく機能します。

Image Promptを選択してください。

複数の入力も要素が混在した画像が生成できます。

PyraCanny

ピラミッドベースのCannyエッジ（輪郭や境界を抽出します）

Advancedにチェックを入れてPyraCannyを選択してください。

CPDS

CPD (Contrast Preserving Decolorization) の構造抽出を使用したモデルになります。この方法は、高速でダウンロード不要のプリプロセッサを使用します。また、Cannyのように細かく抽出はしないようです。

Advancedにチェックを入れてCPDSを選択してください。

FaceSwap

入力画像の顔をスワップして画像を生成します。入力画像の顔をトリミングする必要もありません。プロンプトと組み合わせるといいでしょう。

Advancedにチェックを入れてFaceSwapを選択してください。

Inpaint

インペイント機能が使えます。表情の変更やオブジェクトの追加などができ、とても綺麗に描きなおしてくれます。

画像をアップロードして修復したい部分を塗りつぶしてください。MethodはInpaint or Outpaint（デフォルト）のほかにImprove Detail (顔や手などのディテール向上)やModify Content (オブジェクトの追加や背景の変更)などがあるので用途に合わせて選択してください。