lda参数的最佳实践是什么?

iih3973s  于 2021-06-02  发布在  Hadoop
关注(0)|答案(0)|浏览(261)

我有许多文件(让我们sat 5000),我想从他们提取一些主题使用tha cvb (lda)在mahout。它有许多不同的参数,从潜在主题的数量(-k)、最大迭代次数(maxiter)、每个文档的最大迭代次数(-mipd)、文档主题的平滑度(-a)、术语主题的平滑度(-e)、种子(-seed)开始。我知道设置参数取决于我的应用程序,但最佳实践是什么?e、 g.建议将-s设置为k/50。
我对-mipd,-maxiter,-e特别感兴趣。
参数 seqsparse 命令需要什么?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题