RVC学習済みモデルでリアルタイムボイスチェンジを行う (VC Client)

VC Client AIツール

RVC学習済みモデルを使ってリアルタイムボイスチェンジができるVC Clientの紹介と仮想オーディオデバイスを使ってほかのソフトでも利用する方法を紹介します。

VC Clientとは

各種音声変換AIを用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換AIは以下のものになります。

  • MMVC
  • so-vits-svc
  • RVC (Retrieval-based Voice Conversion)
  • DDSP-SVC
  • Beatrice JVS Corpus Edition (実験的、Windowsのみ、CPUによる)
  • Beatrice v2(開発中)

RVCでモデルを作成したい方は以下の記事をご覧ください。

VC Clientのインストール

VC Client ダウンロード
VC Clientバージョン実行環境ダウンロードファイル
v2Windows CPU / GPU (AMD, NVIDIA)vcclient_win_std
Windows GPU (NVIDIA)のみvcclient_win_cuda
Mac (Apple silicon)vcclient_mac
v1Windows CPU / GPU (NVIDIA)win_onnxgpu-cuda
Windows GPU (AMD, Intel)win_onnxdirectML-cuda
Macmac_onnxcpu-nocuda

実行環境に合わせてファイルをダウンロードしてください。バージョンが複数あるので更新日の新しいものでよいかと思います。

Windows版は、ダウンロードファイルを解凍してstart_http.batを実行してください。

Mac版は、ダウンロードファイルを解凍してstartHttp.commandを実行してください。

VC Client インストール

初回起動時は、データのダウンロードに時間がかかることがあります。ダウンロードが完了するとソフトが立ち上がります。

Voice Changer Client

こちらがUIになります。あらかじめ複数のモデルが用意されています。

VC Clientの使い方

基本的な使い方

VC Client 使い方
  1. 音声モデルを選択します(右の編集からモデルを追加できます)
  2. 入力と出力先を選択します。monitorは変換後の音声を確認しながら使いたい場合に設定します(イヤホンなどに設定するといいでしょう)
  3. startで数秒のデータロード後に音声変換が開始されます。

設定

重要なものを紹介します。

VC Client 設定
  • GAIN inはマイクの感度を調整します。outは出力音量を調整します。
  • TUNE ピッチの変更ができます。自分の声と変換する声の高低の違いで調整してください。
  • CHUNK 数値が大きいほど遅延が大きくなるが高音質、小さく設定すると低遅延になるが音質が悪くなります。

ほかの項目の設定についても知りたい方はマニュアルをチェックしてください(アプリ画面左上に並んでいるアイコンからページに飛べます)

仮想オーディオデバイス

とりあえずVC Client上でリアルタイムボイスチェンジができるようになったと思いますが、ほかのソフト(OBSやDiscordなど)でボイスチェンジ後の音声だけを取り込みたい場合は、仮想オーディオデバイスが必要になります。

今回はVB-CABLEという無料ソフトを使います。

ダウンロードしたファイルを解凍してVBCABLE_Setup_x64を実行してインストールしてください。

VB-CABLE 仮想オーディオデバイス追加

入力と出力に仮想オーディオデバイスが追加されるのでこれらを使います。

VC Client VB-CABLE設定

VC ClientのoutputをCABLE Inputに設定します。

OBS VB-CABLE設定
例 OBSの音声入力キャプチャ

利用したいソフトの入力にCABLE Outputを選択することでCABLE Inputに出力された音声を取り込むことができます。

タイトルとURLをコピーしました