使用时我很困惑 model.summary.areaUnderROC
从 pyspark.mllib
--假设我们已经准备好了列车数据 data_train
,那么
model = LogisticRegression().fit(data_train)
给予 model
由列车数据伪造。
我不明白为什么我们要用以下公式来计算这个模型的aoc: model.summary.areaUnderROC
它使用列车数据来验证由列车数据构建的模型——使结果始终接近1。
与sklearn比较,sklearn使用测试数据和预测进行计算 AOC
,Spark是不是 model.summary.areaUnderROC
有什么意义吗?
暂无答案!
目前还没有任何答案,快来回答吧!