音声合成 テキストプロンプトから音楽を生成できるモデル (Stable Audio Open)
Stable Audio Open 1.0は、リアルなボーカルは生成できませんが最大47秒間の可変長ステレオオーディオを44.1kHzで生成できます。ローカル環境でのインストールと生成を試してみてください。
音声合成
動画生成
ソフトウェア
3DCG
ソフトウェア
画像生成
ソフトウェア
動画生成
画像生成
自作PC