BERTopic 在进度条完成后,模型建立花费了很长时间,

2hh7jdfx  于 5个月前  发布在  其他
关注(0)|答案(2)|浏览(66)

我很惊讶我的模型需要8小时以上的时间来运行,所以我设置了'verbose = True'来监控进度。令我惊讶的是,我在一小时内就完成了进度条,但单元格在之后的几个小时里仍在运行(现在仍然如此)。我已经添加了我的代码和输出的屏幕截图供参考。我不认为问题出在保存模型上,因为如果我结束单元格进程并尝试使用模型,它会说模型不存在。

vxqlmq5t

vxqlmq5t1#

我相信进度条只覆盖算法的嵌入部分。
有关建议改进,请参阅 #1566

hs1ihplo

hs1ihplo2#

我惊讶地发现我的模型运行需要超过8小时,所以我设置了'verbose = True'来监控进度。令我惊讶的是,进度条在一小时内就完成了,但单元格在运行了几个小时后仍然在运行(现在也是如此)。我已经添加了代码截图和输出以供参考。我不认为问题出在保存模型上,因为如果我结束单元格进程并尝试使用模型,它会提示模型不存在。

的确,进度条只表示嵌入文档并将它们转换为数值表示。很可能是模型在执行聚类时挂起,这是降维之后的步骤。

您可以采取一些措施来加快模型的速度。最重要的一点是设置calculate_probabilities=False。您是否阅读过常见问题解答?那里有一些对您有帮助的提示。

相关问题