linux TTS语音克隆

ffvjumwh  于 2022-12-18  发布在  Linux
关注(0)|答案(1)|浏览(226)

我使用coqui的开源库构建了一个语音克隆模型。它使用了不同的tts_models,这些tts_models是使用LJSpeech数据集训练的。我使用多语言模型来使用我提供的示例。但是,我一直收到这个错误:
ValueError:[!]看起来您使用的是多语言模型。您需要定义language_namestyle_wav才能使用多语言模型。
我使用了Googlecolab的虚拟环境,因为Coqui是为Linux开发的。
下面是我的代码:

!git clone https://github.com/coqui-ai/TTS
!pip install TTS
!sudo apt-get install espeak-ng
!pip install IPython

from google.colab import drive
drive.mount('/content/drive')

import os
os.chdir('/content/drive/MyDrive/TTS')

!cd TTS

!ls

!tts --list_models

!python -c 'from TTS.utils.downloaders import download_ljspeech; download_ljspeech("/content/drive/MyDrive/TTS/recipes/ljspeech/");'

!tts --text "The economy suffered a great deal." \
    --model_name "tts_models/multilingual/multi-dataset/your_tts" --speaker_wav "/content/drive/MyDrive/TTS/recipes/ljspeech/LJSpeech-1.1/Sample.wav"  --out_path /content/drive/MyDrive/TTS/output.wav

from IPython.display import Audio
display(Audio('/content/drive/MyDrive/TTS/output.wav'))

相关问题