seg_list = jieba.cut("他来到了网易杭研大厦") # 默认是精确模式 print(", ".join(seg_list)) 他, 来到, 了, 网易, 杭研, 大厦
但是在分词过程中判断词性
words = pseg.cut("来到了网易杭研大厦") for word, flag in words: ... print('%s %s' % (word, flag))
依旧会把“杭研”分为两个词 杭 j 研 vn ;如何判断“杭研”是否为新词?
vktxenjb1#
可以參考我修正的錯誤 #670
1条答案
按热度按时间vktxenjb1#
可以參考我修正的錯誤 #670