Style-Bert-VITS2をインストールしたので記録を残します。
環境
Ubuntu22.04
Python 3.10.12
gitクローン
git clone https://github.com/litagin02/Style-Bert-VITS2.git
venv作成
cd Style-Bert-VITS2
python3 -m venv venv
source venv/bin/activate
パッケージをインストール
pip install -r requirements.txt
初期処理
モデルのダウンロード
python initialize.py
実行
python server_editor.py
ホスト側のWindows11のウェブブラウザでhttp://127.0.0.1:8000にアクセスしたところ「Style-Bert-VITS2 エディター」が起動しました。
テキストを入力し「音声合成」ボタンを押したところ合成された音声が再生されました。
学習
モデルを学習することも出来るそうです。
python app.py
こちらはWebUIが起動することをを確認しただけです。
追記:20250318
モデルの学習を試してみました。感情表現が過剰な感じになりましたが、かなりの再現度です。
コメント