RVC学習済みモデルを使ってリアルタイムボイスチェンジができるVC Clientの紹介と仮想オーディオデバイスを使ってほかのソフトでも利用する方法を紹介します。
VC Clientとは
各種音声変換AIを用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換AIは以下のものになります。
- MMVC
- so-vits-svc
- RVC (Retrieval-based Voice Conversion)
- DDSP-SVC
- Beatrice JVS Corpus Edition (v.1.5.3.16からサポート、Windows CPUのみ)
RVCでモデルを作成したい方は以下の記事をご覧ください。
VC Clientのインストール
実行環境 | ダウンロードファイル |
---|---|
Windows NVIDIA / GPUなし | win_onnxgpu-cuda |
Windows AMD / Intel | win_onnxdirectML-cuda |
Mac | mac_onnxcpu-nocuda |
実行環境に合わせてファイルをダウンロードしてください。バージョンが複数あるので更新日の新しいものでいいかと思います。
Windows版は、ダウンロードファイルを解凍してstart_http.batを実行してください。
Mac版は、ダウンロードファイルを解凍してstartHttp.commandを実行してください。
初回起動時は、データのダウンロードに時間がかかることがあります。ダウンロードが完了するとソフトが立ち上がります。
こちらがUIになります。あらかじめ複数のモデルが用意されています。
VC Clientの使い方
基本的な使い方
- 音声モデルを選択します(右の編集からモデルを追加できます)
- 入力と出力先を選択します。monitorは変換後の音声を確認しながら使いたい場合に設定します(イヤホンなどに設定するといいでしょう)
- startで数秒のデータロード後に音声変換が開始されます。
設定
重要なものを紹介します。
- GAIN 入力と出力の音量調整ができます。
- TUNE ピッチの変更ができます。自分の声と変換する声の高低の違いで調整してください。
- CHUNK 遅延と音質に影響があるので調整してください。
ほかの項目の設定についても知りたい方はマニュアルをチェックしてください。
仮想オーディオデバイス
とりあえずVC Client上でリアルタイムボイスチェンジができるようになったと思いますが、ほかのソフト(OBSやDiscordなど)でボイスチェンジ後の音声だけを取り込みたい場合は、仮想オーディオデバイスが必要になります。
今回はVB-CABLEという無料ソフトを使います。
ダウンロードしたファイルを解凍してVBCABLE_Setup_x64を実行してインストールしてください。
入力と出力に仮想オーディオデバイスが追加されるのでこれらを使います。
VC ClientのoutputをCABLE Inputに設定します。
利用したいソフトの入力にCABLE Outputを選択することでCABLE Inputに出力された音声を取り込むことができます。