BERTopic 如何对BERTTopic进行预处理?

brqmpdu1  于 4个月前  发布在  其他
关注(0)|答案(1)|浏览(53)

我理解BERT在某种程度上不需要预处理,但我不想让某些词被识别为主题,因为我的主题建模的目标。我该如何实现这个目标?

fkaflof6

fkaflof61#

如果你想移除某些词,可以使用CountVectorizer来实现。将你想要移除的词列表作为stop_words参数的值。

相关问题