jieba 启用paddle模式,中文分词词性标注标点符号会被标上v

utugiqy6  于 2022-10-22  发布在  其他
关注(0)|答案(1)|浏览(162)

def cut_word_in_paddle(self, input_str: str):
jieba.enable_paddle() # 启动paddle模式。 0.40版之后开始支持,早期版本不支持

input_str2=self.remove_punctuation(input_str)

words = pseg.cut(input_str, use_paddle=True)

logger.info("Paddle Mode: " + '/'.join(list(seg_list)))

return '/'.join(list(seg_list))

for word, flag in words:
print('%s %s' % (word, flag))

词性标注结果:
编织袋 n
。 v
8月16日上午7时30分 TIME

测试环境:macOS 11.1 python 3.8.5
jieba:0.42.1
paddlepaddle:2.0.0rc1

相关问题