在我们对训练数据拟合逻辑回归模型后,是否有方法获得我们收到的每个系数的显著性水平?我在想办法,但自己想不出来。我想如果我运行卡方检验,我可能会得到每个特征的显著性水平,但首先不确定我是否可以对所有特征一起运行检验,其次我有数字数据值,所以它是否会给予我正确的结果,这仍然是一个问题。现在,我正在使用statsmodel和scikitlearn运行建模部分,但我当然想知道,如何从PySpark ML或MLLib本身获得这些结果如果有人能提供一些线索,这将是有帮助的
bis0qfac1#
我只使用mllib,我认为在训练模型时,可以使用toPMML方法将模型导出为PMML格式(xml文件),然后可以解析xml文件以获取要素权重,这里是一个示例https://spark.apache.org/docs/2.0.2/mllib-pmml-model-export.html希望能有所帮助
1条答案
按热度按时间bis0qfac1#
我只使用mllib,我认为在训练模型时,可以使用toPMML方法将模型导出为PMML格式(xml文件),然后可以解析xml文件以获取要素权重,这里是一个示例
https://spark.apache.org/docs/2.0.2/mllib-pmml-model-export.html
希望能有所帮助