我正在使用MobileNet训练一组图像,它可以进行多类分类。训练后的损失时期曲线看起来像这样:
我不知道如何解释这一点,如果这是足够好/可接受的?但最后有一些尖峰,所以我假设这不是很好?如何改善这一点?
ie3xauqp1#
模型收敛时出现峰值是一种常见的现象。这个问题可以在许多CNN或基于transformer的分类模型中观察到,例如“ResNet”论文中的图。
您可能还注意到,许多损失曲线看起来非常平滑;这是因为它们采用“移动平均”来呈现更平滑的损失曲线。因此,我建议训练更多的epoch来观察损失曲线的变化,或者选择一个较小的学习率。此外,您可以利用检查点来保存具有最低验证损失的模型。
1条答案
按热度按时间ie3xauqp1#
模型收敛时出现峰值是一种常见的现象。这个问题可以在许多CNN或基于transformer的分类模型中观察到,例如“ResNet”论文中的图。
您可能还注意到,许多损失曲线看起来非常平滑;这是因为它们采用“移动平均”来呈现更平滑的损失曲线。
因此,我建议训练更多的epoch来观察损失曲线的变化,或者选择一个较小的学习率。此外,您可以利用检查点来保存具有最低验证损失的模型。