jieba 未能成功标注词性

3duebb1j  于 2022-10-22  发布在  其他
关注(0)|答案(1)|浏览(238)

未能成功标注地名的词性,示例:

import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州滨州市")
for word, flag in words:
    if flag == 'ns':
        print('%s' % (word))

结果输出了滨州,而没有滨州市

import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州首尔冲绳")
for word, flag in words:
    if flag == 'ns':
        print('%s' % (word))

结果只输出了滨州 而没有首尔冲绳

uqxowvwt

uqxowvwt1#

而类似于 北京北京市 或者 天津天津市 这种的却能被正确识别
我怀疑是字典没有完整收录地名
添加 自定义字典 虽然能缓解这一问题,但未免看起来很奇怪

相关问题