BERTopic 将详细模式设置得更详细

lhcgjxsq  于 5个月前  发布在  其他
关注(0)|答案(5)|浏览(71)

在长时间运行的fittransform调用期间,输出可能会更加详细。目前我们看到在某些阶段完成后会出现logger.info消息。然而,我们没有看到进程目前正在花费时间的阶段。
很高兴为此贡献一个PR。

kyks70gy

kyks70gy1#

感谢您的反馈!我想要防止记录过多,以便尽可能清晰地了解整个过程。然而,我确实可以看到在主要步骤之前和之后进行日志记录的使用场景。也许还可以记录每个步骤的墙钟时间?

2wnc66cl

2wnc66cl2#

是的,这也会很有用。如果在嵌入步骤之外的其他地方可能有更多的进度条。

y1aodyip

y1aodyip3#

进度条应该放在哪里?我认为最长的迭代过程只存在于嵌入步骤和表示模型中。聚类和降维并不自然地适合用进度条表示。

j1dl9f46

j1dl9f464#

了解。请查看相关问题,以了解算法在何处花费时间可能存在的困惑。对于表示步骤(例如OpenAI API调用),有一个进度条会很好。

ifmq2ha2

ifmq2ha25#

谢谢!这已经在主分支中实现,并将在引入更多功能后在即将发布的版本中正式发布。

相关问题