我想用wiki做自定义词库,已经用gensim训练出一个模型。不知道用wiki是否比人民日报的效果好?不知道自定义词库格式要求是怎么样的?有没有现成的工具可以制作词库?
7ivaypg91#
文档中可以jieba支持自定义加载用户词库的功能,而且自定义的词库的格式也比较简单,我自己是写了一个python脚本来建立自己的词库的。
t1qtbnec2#
谢谢 @super1-chen请问用了user_dict是否会覆盖原来的默认词库?
2条答案
按热度按时间7ivaypg91#
文档中可以jieba支持自定义加载用户词库的功能,而且自定义的词库的格式也比较简单,我自己是写了一个python脚本来建立自己的词库的。
t1qtbnec2#
谢谢 @super1-chen
请问用了user_dict是否会覆盖原来的默认词库?