画像生成 FLUX.1 Toolsの紹介 FLUX.1 Toolsは、Black Forest Labsがリリースしたモデル群で、ControlNetのように実際の画像や生成画像の編集や再生成を可能にします。また、ベンチマーク結果では、他のオープンソースバリアントを上回る性能と高い... 2024.12.21 画像生成
画像生成 FLUX.1によるインペインティングとアウトペインティング Black Forest Labsが提供するFLUX.1最新のインペインティング・アウトペインティングモデルを紹介します。 2024.12.12 画像生成
画像生成 FLUX.1量子化モデルの比較 FLUX.1のオリジナルモデルは、ファイルサイズが大きくVRAMが少ない環境では扱いにくいです。ここでは、複数の量子化されたモデルの紹介とそれぞれの生成結果を比較しました。量子化とは、数値を離散的な値に変換することでデータの精度を下げつつ、... 2024.12.08 画像生成
画像生成 FLUXのControlNetワークフロー (ComfyUI) ComfyUIでFLUXにControlNetを適用するワークフローを紹介します。XLabs AIとShakker Labsが提供しているControlNetモデルになります。Black Forest LabsがFLUX.1 Toolsをリ... 2024.10.19 画像生成
画像生成 FluxのLoRA学習を行う (Flux Gym) Flux Gymは、AI-ToolkitとKohya Scriptsを組み合わせたFLUX LoRAをトレーニングするためのシンプルな WebUIです。LOW VRAM (12GB/16GB/20GB)もサポートしておりミドルグラボでも学習... 2024.10.09 画像生成
画像生成 ComfyUIでFLUXモデルを試す Black Forest LabsがリリースしたText to ImageのFLUX.1は、ベンチマーク(ELOスコア)で他の主要モデルよりも上回っています。今回ComfyUIのアップデートでFLUXがサポートされローカルでも簡単に試すこと... 2024.08.08 画像生成
音声合成 テキストプロンプトから音楽を生成できるモデル (Stable Audio Open) Stable Audio Open 1.0は、リアルなボーカルは生成できませんが最大47秒間の可変長ステレオオーディオを44.1kHzで生成できます。ローカル環境でのインストールと生成を試してみてください。 2024.07.30 音声合成
動画生成 画像や動画の人物の表情をコントロールする (LivePortrait) LivePortraitでは、ビデオから得られたモーション(顔の表情や頭のポーズなど)を使用して、リアルなビデオを合成することができます。 2024.07.14 動画生成