我可以在pyspark中提取Logistic回归系数的显著值吗

du7egjpx 于 2023-01-29 发布在 Spark

关注(0)|答案(1)|浏览(179)

在我们对训练数据拟合逻辑回归模型后，是否有方法获得我们收到的每个系数的显著性水平？
我在想办法，但自己想不出来。
我想如果我运行卡方检验，我可能会得到每个特征的显著性水平，但首先不确定我是否可以对所有特征一起运行检验，其次我有数字数据值，所以它是否会给予我正确的结果，这仍然是一个问题。
现在，我正在使用statsmodel和scikitlearn运行建模部分，但我当然想知道，如何从PySpark ML或MLLib本身获得这些结果
如果有人能提供一些线索，这将是有帮助的

pyspark

来源：https://stackoverflow.com/questions/40980666/can-i-extract-significane-values-for-logistic-regression-coefficients-in-pyspark

1条答案

按热度按时间

bis0qfac1#

我只使用mllib，我认为在训练模型时，可以使用toPMML方法将模型导出为PMML格式（xml文件），然后可以解析xml文件以获取要素权重，这里是一个示例
https://spark.apache.org/docs/2.0.2/mllib-pmml-model-export.html
希望能有所帮助

赞(0）回复(0）举报 2023-01-29

我来回答

我可以在pyspark中提取Logistic回归系数的显著值吗

1条答案

相关问题

热门标签

最新问答