jieba TF_IDF分析三国演义的地名,为何结果完全不对?

okxuctiv  于 4个月前  发布在  其他
关注(0)|答案(1)|浏览(41)

部分代码:
sentence = getText('三国演义.txt')
keywords = jieba.analyse.extract_tags(sentence, topK=20, withWeight=True, allowPOS=('ns'))
按地名统计前20,出来的结果是:
将军 0.11860080694708297
丞相 0.0921638281251496
主公 0.0715118726461463
军士 0.061001657055284146
商议 0.05922492016471381
云长 0.054936383725351035
军马 0.05441077997191448
大喜 0.05001738396254889
后主 0.04707253654544958
先主 0.04402888433316952
都督 0.04296257804954991
众将 0.04167988860499132
天下 0.03893417374252234
陛下 0.03882608055724891
太守 0.035023324694504726
人马 0.03359843706149093
城上 0.03265662810340311
天子 0.03212681223959663
后人 0.03164288695617565
众官 0.03082541531255808

这是怎么统计出来的地名?完全不对啊!

bxjv4tth

bxjv4tth1#

地名可能没在词典里 或者被标注为别的名词性

相关问题