我有数据集输入2D图像,应该预测[-500,+500]之间的3D矩阵值。我的问题是如何使模型预测负值,哪个激活函数?特别是范围很大的值必须是整数而不是浮点数。标准化0-1范围使预测更困难。
r8xiu3jd1#
这里的任务到底是什么?有无数种方法可以做到这一点,但哪一种是最佳的取决于更多的信息。你可以使用一个钳位函数,如tanh或sigmoid和移位/缩放。例如500 tanh或1000(sigmoid-0.5)都给予你的输出范围为-500:500。或者,如果你只想要离散值输出,你可以只有1001个输出,并将每个输出Map到-500:500的值。
o8x7eapl2#
如果是回归任务,最后一层不需要任何激活函数。但是,仍然建议使用缩放/归一化,否则最后一层需要太大的权重。因此,我将归一化数据,以便您的输出值大致在[-3,3]范围内。
2条答案
按热度按时间r8xiu3jd1#
这里的任务到底是什么?有无数种方法可以做到这一点,但哪一种是最佳的取决于更多的信息。你可以使用一个钳位函数,如tanh或sigmoid和移位/缩放。例如500 tanh或1000(sigmoid-0.5)都给予你的输出范围为-500:500。或者,如果你只想要离散值输出,你可以只有1001个输出,并将每个输出Map到-500:500的值。
o8x7eapl2#
如果是回归任务,最后一层不需要任何激活函数。但是,仍然建议使用缩放/归一化,否则最后一层需要太大的权重。因此,我将归一化数据,以便您的输出值大致在[-3,3]范围内。