jieba extract_tags结果会遗漏分词

polhcujo  于 2个月前  发布在  其他
关注(0)|答案(2)|浏览(35)

楼主,一直以来用你的jieba分词,感谢你无私的分享!

近来发现一个问题:

for i in jieba.analyse.extract_tags('上海一日游攻略'):
print i

输出结果:
攻略
上海

我看到idf.txt中‘一日游’与‘攻略’这个词的IDF相差无几,为什么没‘一日游’这个词呢?

不太明白其中原理。

aor9mmx1

aor9mmx11#

@bobo1732 , 我这里没有复现此bug,请问你的版本是多少?

bybem2ql

bybem2ql2#

@fxsjy 我是用的0.35版本

相关问题