我可以在pyspark中提取Logistic回归系数的显著值吗

du7egjpx  于 2023-01-29  发布在  Spark
关注(0)|答案(1)|浏览(180)

在我们对训练数据拟合逻辑回归模型后,是否有方法获得我们收到的每个系数的显著性水平?
我在想办法,但自己想不出来。
我想如果我运行卡方检验,我可能会得到每个特征的显著性水平,但首先不确定我是否可以对所有特征一起运行检验,其次我有数字数据值,所以它是否会给予我正确的结果,这仍然是一个问题。
现在,我正在使用statsmodel和scikitlearn运行建模部分,但我当然想知道,如何从PySpark ML或MLLib本身获得这些结果
如果有人能提供一些线索,这将是有帮助的

bis0qfac

bis0qfac1#

我只使用mllib,我认为在训练模型时,可以使用toPMML方法将模型导出为PMML格式(xml文件),然后可以解析xml文件以获取要素权重,这里是一个示例
https://spark.apache.org/docs/2.0.2/mllib-pmml-model-export.html
希望能有所帮助

相关问题