BERTopic 在减少离群值后,分配给文本的簇发生了变化,

ibrsph3r  于 5个月前  发布在  其他
关注(0)|答案(1)|浏览(56)

你好,
我正在尝试根据这个页面减少离群值。但是我在减少离群值后发现,一些文本的分配的聚类(在减少离群值之前)变成了不同的聚类。根据“您可以将离群值和非离群值文档一起传递,因为它只会尝试减少离群值文档并将它们标记为非离群主题。”,已经分配的聚类不应该在减少离群值后发生变化吗?这是预期的现象还是因为我在某个地方理解有误,或者它本身存在问题?
感谢您帮助我解决这个问题!

t2a7ltrp

t2a7ltrp1#

当你使用.reduce_outliers时,确实应该是这样的情况。为了完整性,你有一个可复现的例子吗?

相关问题