This simple sentence:今天下午三点提醒我开会
,
when I am using posseg but pos this sentence, got this result:
[pair('今天下午', 'nr'), pair('三点', 'm'), pair('提醒', 'v'), pair('我', 'r'), pair('开会', 'v')]
Obviously, this not we want, 今天下午 should be 't' rather than 'nr'.
Even I am using user_dict to separate 今天 and 下午, no result.
6条答案
按热度按时间wko9yo5t1#
这个jieba词性烂的很,不建议用,应该是训练数据问题
ql3eal8s2#
当然跟分词效果也有很大关系,你这个明显是分词不对,应该是今天/下午
34gzjxbg3#
真的有这么烂??
z9gpfhce4#
我也遇到了这个,简直不能相信。然后一搜居然真有这么个issue……
e5nqia275#
@su27 ,
我们支持paddle内核了, 可以用paddle 模式。效果如下:
今天下午三点/TIME
提醒/v
我/r
开会/v
yxyvkwin6#
@su27 ,
我们支持paddle内核了, 可以用paddle 模式。效果如下:
今天下午三点/TIME
提醒/v
我/r
开会/v
好的多谢,我试试