WSL-UbuntuでStyle-Bert-VITS2をインストールした記録

Style-Bert-VITS2をインストールしたので記録を残します。

環境

Ubuntu22.04
Python 3.10.12

git clone https://github.com/litagin02/Style-Bert-VITS2.git

cd Style-Bert-VITS2
python3 -m venv venv
source venv/bin/activate

pip install -r requirements.txt

モデルのダウンロード

python initialize.py

 python server_editor.py

ホスト側のWindows11のウェブブラウザでhttp://127.0.0.1:8000にアクセスしたところ「Style-Bert-VITS2 エディター」が起動しました。
テキストを入力し「音声合成」ボタンを押したところ合成された音声が再生されました。

モデルを学習することも出来るそうです。

python app.py

こちらはWebUIが起動することをを確認しただけです。

追記:20250318

モデルの学習を試してみました。感情表現が過剰な感じになりましたが、かなりの再現度です。