我有许多文件(让我们sat 5000),我想从他们提取一些主题使用tha cvb (lda)在mahout。它有许多不同的参数,从潜在主题的数量(-k)、最大迭代次数(maxiter)、每个文档的最大迭代次数(-mipd)、文档主题的平滑度(-a)、术语主题的平滑度(-e)、种子(-seed)开始。我知道设置参数取决于我的应用程序,但最佳实践是什么?e、 g.建议将-s设置为k/50。我对-mipd,-maxiter,-e特别感兴趣。参数 seqsparse 命令需要什么?
cvb
seqsparse
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!