有序回归学习笔记

x33g5p2x  于2022-04-21 转载在 其他  
字(0.6k)|赞(0)|评价(0)|浏览(464)

以下内容转自:

有序回归(ordinal regression)_音程的博客-CSDN博客_ordinal regression

假如有如下训练数据:

(x1,明天),(x2,后天),(x3,大后天)。

其中第一项x表示一个事件,第二项表示该事件发生的时间。
现在需要你训练一个模型,能够给定事件x作为输入,输出其发生的时间。

乍一看是一个分类(classification)问题。

但是如果采用普通的分类方法,由于以上标签会被one-hot编码成:

(x1,(1,0,0)),(x2,(0,1,0)),(x3,(0,0,1))。

所以分类的时候,当预测错了类别的时候,损失是一样的。因为one-hot编码中类别之间距离是一样的。

即给定x,如果模型预测的结果是明天。我们会发现真实标签是后天或者大后天都是一样的损失。这不合理,因为我们观察到这些标签有顺序关系,预测结果是明天时,真实标签是大后天应该比后天带来更大的损失才对,因为更加遥远,更加错误。

解决办法:有序回归。

为了突显有序可以将以上数据编码成

(x1,0),(x2,1),(x3,2)。
————————————————
版权声明:本文为CSDN博主「音程」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_43391414/article/details/113034297

相关文章