请提出你的问题https://github.com/wdimmy/Automatic-Corpus-Generation/blob/master/corpus/train.sgml通过编辑此数据集,增加自己的专有纠错语句文本,结果一个都没有识别到,原有数据源中的都可以正常识别到,请教一下,增加自己的数据去训练是还需要其他步骤吗?如下图,上面两句是自定义的(不能纠错),下面那个是文本自带的(正常)
train.sgml文件如下
训练按照如下教程:https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_correction/ernie-csc
k97glaaz1#
请教下自训练数据集流程,
1条答案
按热度按时间k97glaaz1#
请教下自训练数据集流程,