BERTopic 减少加载模型的离群值

qaxu7uf2  于 5个月前  发布在  其他
关注(0)|答案(1)|浏览(62)

你好!
一个月前,我创建了一个主题模型并将其保存为:topic_model.save(outpath, serialization="safetensors")。然后我在模型中减少了离群值,得到了new_topics = topic_model.reduce_outliers(docs, topics),并将其用于实证分析,但我没有保存更新后的主题模型。
现在我想生成分析中使用的主题的可视化,所以我加载了数据框(并再次定义了文档),加载了模型并尝试再次减少离群值,但我遇到了错误,而且不确定如何解决。以下是代码和错误:

loaded_model = BERTopic.load("Only-English-BERT-topic-meaning-min-size-50")
topics = loaded_model.topics_
new_topics = loaded_model.reduce_outliers(docs, topics)
  • sklearn.exceptions.NotFittedError: Vocabulary not fitted or provided*_

我还尝试使用topics, probs = loaded_model.transform(docs),但我得到了相同的错误。
如果能帮助我解决这个问题,将不胜感激。
提前感谢您的时间!

r6hnlfcb

r6hnlfcb1#

你使用的是哪个版本的BERTopic?它和保存模型时一样吗?
另外,你能提供完整的错误信息吗?我不清楚这个错误指的是什么。

相关问题