未能成功标注地名的词性,示例:
import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州滨州市")
for word, flag in words:
if flag == 'ns':
print('%s' % (word))
结果输出了滨州,而没有滨州市
import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州首尔冲绳")
for word, flag in words:
if flag == 'ns':
print('%s' % (word))
结果只输出了滨州 而没有首尔冲绳
1条答案
按热度按时间uqxowvwt1#
而类似于
北京北京市
或者天津天津市
这种的却能被正确识别我怀疑是字典没有完整收录地名
添加 自定义字典 虽然能缓解这一问题,但未免看起来很奇怪