jieba 怎么自动过滤停用词和标点符号?

de90aj5v  于 2022-11-05  发布在  其他
关注(0)|答案(1)|浏览(146)
  • No description provided.*
fwzugrvs

fwzugrvs1#

你可能用yield過濾。比如說:

def 過濾(input_text):
    for token in jieba.cut(input_text):
        if token not in ",.?;'[]()`~!@#$%^&*/+_-=<>{}:,。?!·;:‘“、\"":
            yield token

相关问题