AIツール

AIツール

ComfyUI 3D Packを活用して3Dアセットを作成する

ComfyUI 3D Packは、画像や動画と同様に、3Dアセット生成を手軽かつ高品質に実現するノード群です。最新の3D技術やアルゴリズムを活用し、メッシュやUVテクスチャの処理をスムーズにサポートします。
音声合成

MMAudioで無音動画にオーディオを追加する

MMAudioは、動画と必要に応じてテキストを入力条件として、高品質で同期されたオーディオを生成できます。整合性の取れた高品質な音と映像の同期精度を実際にご覧ください。
動画生成

LTX-Videoを使ったテキスト&画像からの動画生成

LTX Videoは、高品質な動画を生成可能なDiTベースの動画生成モデルです。このモデルは、768x512の解像度で24FPSの動画を高速に生成でき、テキストからの動画生成および画像+テキストからの動画生成の両方に対応しています。
画像生成

FLUX.1 Toolsの紹介

FLUX.1 Toolsは、Black Forest Labsがリリースしたモデル群で、ControlNetのように実際の画像や生成画像の編集や再生成を可能にします。また、ベンチマーク結果では、他のオープンソースバリアントを上回る性能と高い...
画像生成

FLUX.1によるインペインティングとアウトペインティング

Black Forest Labsが提供するFLUX.1最新のインペインティング・アウトペインティングモデルを紹介します。
画像生成

FLUX.1量子化モデルの比較

FLUX.1のオリジナルモデルは、ファイルサイズが大きくVRAMが少ない環境では扱いにくいです。ここでは、複数の量子化されたモデルの紹介とそれぞれの生成結果を比較しました。量子化とは、数値を離散的な値に変換することでデータの精度を下げつつ、...
画像生成

FLUXのControlNetワークフロー (ComfyUI)

ComfyUIでFLUXにControlNetを適用するワークフローを紹介します。XLabs AIとShakker Labsが提供しているControlNetモデルになります。Black Forest LabsがFLUX.1 Toolsをリ...
画像生成

FluxのLoRA学習を行う (Flux Gym)

Flux Gymは、AI-ToolkitとKohya Scriptsを組み合わせたFLUX LoRAをトレーニングするためのシンプルな WebUIです。LOW VRAM (12GB/16GB/20GB)もサポートしておりミドルグラボでも学習...
音声合成

MuseScoreの楽譜からボカロソフトで歌わせるまで

既存曲をボカロソフトで歌わせる方法と無料で使えるボカロソフトの比較と簡単に使い方を紹介します。
画像生成

ComfyUIでFLUXモデルを試す

Black Forest LabsがリリースしたText to ImageのFLUX.1は、ベンチマーク(ELOスコア)で他の主要モデルよりも上回っています。今回ComfyUIのアップデートでFLUXがサポートされローカルでも簡単に試すこと...