jieba ‘今天下午’被分成了人名

cbwuti44  于 2023-02-04  发布在  其他
关注(0)|答案(6)|浏览(166)

This simple sentence:
今天下午三点提醒我开会 ,
when I am using posseg but pos this sentence, got this result:

[pair('今天下午', 'nr'), pair('三点', 'm'), pair('提醒', 'v'), pair('我', 'r'), pair('开会', 'v')]

Obviously, this not we want, 今天下午 should be 't' rather than 'nr'.

Even I am using user_dict to separate 今天 and 下午, no result.

wko9yo5t

wko9yo5t1#

这个jieba词性烂的很,不建议用,应该是训练数据问题

ql3eal8s

ql3eal8s2#

当然跟分词效果也有很大关系,你这个明显是分词不对,应该是今天/下午

34gzjxbg

34gzjxbg3#

真的有这么烂??

z9gpfhce

z9gpfhce4#

我也遇到了这个,简直不能相信。然后一搜居然真有这么个issue……

e5nqia27

e5nqia275#

@su27 ,
我们支持paddle内核了, 可以用paddle 模式。效果如下:

今天下午三点/TIME
提醒/v
我/r
开会/v

yxyvkwin

yxyvkwin6#

@su27 ,
我们支持paddle内核了, 可以用paddle 模式。效果如下:

今天下午三点/TIME
提醒/v
我/r
开会/v

好的多谢,我试试

相关问题