AIツール

AIツール

FLUXのControlNetワークフロー (ComfyUI)

ComfyUIでFLUXにControlNetを適用するワークフローを紹介します。XLabs AIとShakker Labsが提供しているControlNetモデルになります。
AIツール

FluxのLoRA学習を行う (Flux Gym)

Flux Gymは、AI-ToolkitとKohya Scriptsを組み合わせたFLUX LoRAをトレーニングするためのシンプルな WebUIです。LOW VRAM (12GB/16GB/20GB)もサポートしておりミドルグラボでも学習...
AIツール

最新のBiRefNetモデルで画像や動画の背景削除を行う

BiRefNetを用いることで、高精度な分類と詳細なセグメンテーションマップの生成が可能です。今回は、ComfyUIの拡張機能であるComfyUI-BiRefNet-Hugoを使用して、画像や動画の背景を削除します。
AIツール

MuseScoreの楽譜からボカロソフトで歌わせるまで

既存曲をボカロソフトで歌わせる方法と無料で使えるボカロソフトの比較と簡単に使い方を紹介します。
AIツール

ComfyUIでFLUXモデルを試す

Black Forest LabsがリリースしたText to ImageのFLUX.1は、ベンチマーク(ELOスコア)で他の主要モデルよりも上回っています。今回ComfyUIのアップデートでFLUXがサポートされローカルでも簡単に試すこと...
AIツール

テキストプロンプトから音楽を生成できるモデル (Stable Audio Open)

Stable Audio Open 1.0は、リアルなボーカルは生成できませんが最大47秒間の可変長ステレオオーディオを44.1kHzで生成できます。ローカル環境でのインストールと生成を試してみてください。
AIツール

画像や動画の人物の表情をコントロールする (LivePortrait)

LivePortraitでは、ビデオから得られたモーション(顔の表情や頭のポーズなど)を使用して、リアルなビデオを合成することができます。
AIツール

人間の3Dモーションを生成する (MoMask)

テキストからモーションキャプチャ (BVH)を生成することができるMoMaskを紹介します。
AIツール

Stable Diffusion 3をローカル環境で試す

複数主題のプロンプト、画質、スペリング能力におけるパフォーマンスが向上したStable Diffusion 3を試してみました。今までAPIでの提供だったがローカルでも利用できるようになったので利用方法を紹介します。
AIツール

動画や音声に沿って参照画像を動かす (AniPortrait)

フォトリアリスティックなポートレートとオーディオに基づいて高品質な音声合成アニメーションを生成するAniPortraitについて紹介します。