训练完后收敛图不太正常,而且使用时也并不能生成输入的文本语音而是数据库的一段语音,我是按照教程里一步一步训练的,怎么解决?
2g32fytz1#
4500太少了,4w5再看下
ej83mcc02#
我也是从0开始训练,用一千多字的音频切成的180个样本,然后训练了20k steps,但是效果很差很差,通过web合成出来的语言全是杂音。大佬,应该如何完善啊,在已有模型基础上继续训练么,那样音色会不会受到之前模型影响
ajsxfq5m3#
这么少的音频量,不要从0开始,基于现有模型继续训练,有奇效
pengsaosao4#
基于已有的模型,从0开始训练我已经试过了,数据选取量多一些效果更好
4条答案
按热度按时间2g32fytz1#
4500太少了,4w5再看下
ej83mcc02#
我也是从0开始训练,用一千多字的音频切成的180个样本,然后训练了20k steps,但是效果很差很差,通过web合成出来的语言全是杂音。大佬,应该如何完善啊,在已有模型基础上继续训练么,那样音色会不会受到之前模型影响
ajsxfq5m3#
我也是从0开始训练,用一千多字的音频切成的180个样本,然后训练了20k steps,但是效果很差很差,通过web合成出来的语言全是杂音。大佬,应该如何完善啊,在已有模型基础上继续训练么,那样音色会不会受到之前模型影响
这么少的音频量,不要从0开始,基于现有模型继续训练,有奇效
pengsaosao4#
我也是从0开始训练,用一千多字的音频切成的180个样本,然后训练了20k steps,但是效果很差很差,通过web合成出来的语言全是杂音。大佬,应该如何完善啊,在已有模型基础上继续训练么,那样音色会不会受到之前模型影响
这么少的音频量,不要从0开始,基于现有模型继续训练,有奇效
基于已有的模型,从0开始训练我已经试过了,数据选取量多一些效果更好