我理解BERT在某种程度上不需要预处理,但我不想让某些词被识别为主题,因为我的主题建模的目标。我该如何实现这个目标?
fkaflof61#
如果你想移除某些词,可以使用CountVectorizer来实现。将你想要移除的词列表作为stop_words参数的值。
1条答案
按热度按时间fkaflof61#
如果你想移除某些词,可以使用CountVectorizer来实现。将你想要移除的词列表作为stop_words参数的值。