使用naivebayesmllib进行分类时的准确率命中

5jdjgkvh 于 2021-05-30 发布在 Hadoop

关注(0)|答案(0)|浏览(243)

我一直在使用mahout的0.9朴素贝叶斯算法对文档数据进行分类。对于一个特定的序列（2/3的数据）和测试（1/3的数据）集，我得到的准确率在86%的范围内。当我转到spark的mllib时，准确率降到了82%。在这两种情况下都使用标准分析仪。
mllib链接：https://spark.apache.org/docs/latest/mllib-naive-bayes.html mahout链接：http://mahout.apache.org/users/classification/bayesian.html
请帮助我在这方面，因为我必须使用Spark在生产系统很快，这是一个拦路虎为我。
我发现了一个问题，mllib在数据分类方面比mahout花费更多的时间。
有谁能帮我提高使用mllib朴素贝叶斯的准确性。

hadoop machine-learning apache-spark-mllib bigdata mahout

来源：https://stackoverflow.com/questions/25744971/accuracy-hit-in-classification-with-naive-bayes-mllib

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

使用naivebayesmllib进行分类时的准确率命中

暂无答案！

相关问题

热门标签

最新问答