我正在学习一些机器学习的基础知识来预测足球运动员的梦幻足球得分。
我已经建立了一个数据集,并做了一些建模。我的计划是将我的预测与梦幻足球Maven的预测进行比较。
对于我的测试数据,我预测的平均绝对误差= 66.2,而Maven预测的平均绝对误差= 109.3。我在测试集上预测的RMSE = 90.2,而Maven预测的RMSE为150.1。
我以为这意味着我的模型预测会一直击败Maven预测。然而,事实并非如此。当我查看测试集中的特定个体时,我的模型预测只有56%的时间击败Maven预测。
有没有人知道为什么会这样?如果有,我能做些什么来解决这个问题?
(One我注意到,我的模型在预测得分最高的球员方面做得不好,在预测前5名的球员时,它比Maven们的预测要差,尽管它在预测中等水平的球员时做得很好。)
2条答案
按热度按时间ovfsdjhp1#
这可能是因为你的模型在数据上过拟合,这会让你的模型在测试中看起来很棒,但在真实的生活中,它对新数据并不准确。
pes8fvy92#
MAE和RMSE指标告诉您,您的模型平均误差低于Maven模型。这并不一定意味着您的模型对所有单个观测值的误差都较低,请考虑以下示例:有三个数据点,Maven模型的误差为5、5和20,这给出了平均绝对误差30。
您的模型在最后一个错误上有了显著的改进,并实现了错误6、5、14和总MAE 25。
您的MAE低于MavenMAE(适用于RMSE),但您的模型仅在单个示例中实现了较低的误差(1/3的时间)。您甚至可以构建一个MAE低于Maven模型的示例,但大多数情况下,您的残差实际上更高。
它在中间的眼泪做得很好
我的猜测是,这是您获得较好结果的地方,但也许您的模型在较高和较低层中始终较差。
如果有帮助就告诉我!