我做了一个利用aliyun tts批量生成数据集的软件,大家可以尝试使用现成的tts制作更多纯净的语音数据集来反哺自己的模型,暂时只有CLI,没有GUI:
https://github.com/AyahaShirane/Transcript2vioce
希望大家支持,也希望各位大佬帮我继续补全,谢谢
我做了一个利用aliyun tts批量生成数据集的软件,大家可以尝试使用现成的tts制作更多纯净的语音数据集来反哺自己的模型,暂时只有CLI,没有GUI:
https://github.com/AyahaShirane/Transcript2vioce
希望大家支持,也希望各位大佬帮我继续补全,谢谢
3条答案
按热度按时间v1l68za41#
这里的说话人会集中在几个人吗?
kg7wmglp2#
这里的说话人会集中在几个人吗?
将voice参数设置为random可以随机生成28个发音人的内容,再算上语调和语速上的改变,基本上够用
avwztpqn3#
这里的说话人会集中在几个人吗?
将voice参数设置为random可以随机生成28个发音人的内容,再算上语调和语速上的改变,基本上够用
比较适合把vocoder部分训练好一点,其他的会影响模型泛化能力把