pyspark mllib模型摘要'areaunderroc'计算逻辑

iaqfqrcu  于 2021-05-17  发布在  Spark
关注(0)|答案(0)|浏览(313)

使用时我很困惑 model.summary.areaUnderROCpyspark.mllib --假设我们已经准备好了列车数据 data_train ,那么

model = LogisticRegression().fit(data_train)

给予 model 由列车数据伪造。
我不明白为什么我们要用以下公式来计算这个模型的aoc: model.summary.areaUnderROC 它使用列车数据来验证由列车数据构建的模型——使结果始终接近1。
与sklearn比较,sklearn使用测试数据和预测进行计算 AOC ,Spark是不是 model.summary.areaUnderROC 有什么意义吗?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题