RVC学習済みモデルを使ってリアルタイムボイスチェンジができるVC Clientの紹介と仮想オーディオデバイスを使ってほかのソフトでも利用する方法を紹介します。
VC Clientとは
各種音声変換AIを用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換AIは以下のものになります。
- MMVC
- so-vits-svc
- RVC (Retrieval-based Voice Conversion)
- DDSP-SVC
- Beatrice JVS Corpus Edition (実験的、Windowsのみ、CPUによる)
- Beatrice v2(開発中)
RVCでモデルを作成したい方は以下の記事をご覧ください。
VC Clientのインストール
VC Clientバージョン | 実行環境 | ダウンロードファイル |
---|---|---|
v2 | Windows CPU / GPU (AMD, NVIDIA) | vcclient_win_std |
Windows GPU (NVIDIA)のみ | vcclient_win_cuda | |
Mac (Apple silicon) | vcclient_mac | |
v1 | Windows CPU / GPU (NVIDIA) | win_onnxgpu-cuda |
Windows GPU (AMD, Intel) | win_onnxdirectML-cuda | |
Mac | mac_onnxcpu-nocuda |
実行環境に合わせてファイルをダウンロードしてください。バージョンが複数あるので更新日の新しいものでよいかと思います。
Windows版は、ダウンロードファイルを解凍してstart_http.batを実行してください。
Mac版は、ダウンロードファイルを解凍してstartHttp.commandを実行してください。
初回起動時は、データのダウンロードに時間がかかることがあります。ダウンロードが完了するとソフトが立ち上がります。
こちらがUIになります。あらかじめ複数のモデルが用意されています。
VC Clientの使い方
基本的な使い方
- 音声モデルを選択します(右の編集からモデルを追加できます)
- 入力と出力先を選択します。monitorは変換後の音声を確認しながら使いたい場合に設定します(イヤホンなどに設定するといいでしょう)
- startで数秒のデータロード後に音声変換が開始されます。
設定
重要なものを紹介します。
- GAIN inはマイクの感度を調整します。outは出力音量を調整します。
- TUNE ピッチの変更ができます。自分の声と変換する声の高低の違いで調整してください。
- CHUNK 数値が大きいほど遅延が大きくなるが高音質、小さく設定すると低遅延になるが音質が悪くなります。
ほかの項目の設定についても知りたい方はマニュアルをチェックしてください(アプリ画面左上に並んでいるアイコンからページに飛べます)
仮想オーディオデバイス
とりあえずVC Client上でリアルタイムボイスチェンジができるようになったと思いますが、ほかのソフト(OBSやDiscordなど)でボイスチェンジ後の音声だけを取り込みたい場合は、仮想オーディオデバイスが必要になります。
今回はVB-CABLEという無料ソフトを使います。
ダウンロードしたファイルを解凍してVBCABLE_Setup_x64を実行してインストールしてください。
入力と出力に仮想オーディオデバイスが追加されるのでこれらを使います。
VC ClientのoutputをCABLE Inputに設定します。
利用したいソフトの入力にCABLE Outputを選択することでCABLE Inputに出力された音声を取り込むことができます。