音声合成 テキストプロンプトから音楽を生成できるモデル (Stable Audio Open) Stable Audio Open 1.0は、リアルなボーカルは生成できませんが最大47秒間の可変長ステレオオーディオを44.1kHzで生成できます。ローカル環境でのインストールと生成を試してみてください。 2024.07.30 音声合成
動画生成 画像や動画の人物の表情をコントロールする (LivePortrait) LivePortraitでは、ビデオから得られたモーション(顔の表情や頭のポーズなど)を使用して、リアルなビデオを合成することができます。 2024.07.14 動画生成
画像生成 Stable Diffusion 3をローカル環境で試す 複数主題のプロンプト、画質、スペリング能力におけるパフォーマンスが向上したStable Diffusion 3を試してみました。今までAPIでの提供だったがローカルでも利用できるようになったので利用方法を紹介します。 2024.06.13 画像生成
動画生成 動画や音声に沿って参照画像を動かす (AniPortrait) フォトリアリスティックなポートレートとオーディオに基づいて高品質な音声合成アニメーションを生成するAniPortraitについて紹介します。 2024.05.30 動画生成
画像生成 IC-Lightを使用して人物画像のリライティングを行う ポートレートの背景置換と照明の調整を行いリアルな合成写真を生成することができるIC-Lightについて紹介します。 2024.05.14 画像生成
画像生成 Stable Diffusionで透過画像を生成する (SD Forge LayerDiffuse) SD Forge LayerDiffuseのインストールと使い方、一部の機能を紹介します。 2024.05.04 画像生成
画像生成 Stable Diffusion WebUI ForgeとAUTOMATIC1111での画像生成の比較と拡張機能について Stable Diffusion WebUI AUTOMATIC1111をベースに最適化したForgeをインストールしてリソースや推論速度の比較をしました。拡張機能についても少し触れているのでご覧ください。 2024.04.04 画像生成
画像生成 ComfyUI SUPIRを使ってフォトリアリスティックの画像修復を行う 今回はComfyUIでSUPIR(Scaling-UP Image Restoration) という画像復元手法を使って低品質の画像を鮮明な画像に修復する拡張機能を紹介します。WindowsOSとNVIDIAグラフィックボード環境でのインス... 2024.03.22 画像生成
AIツール Wonder3Dで画像からOBJファイルを生成する 一枚の画像から詳細なテクスチャメッシュを再構築Wonder3Dのインストールと使い方について紹介します。 2024.03.08 AIツール