tensorflow 损失时期曲线看起来很奇怪,如何改进多类分类模型?

92dk7w1h  于 2023-10-23  发布在  其他
关注(0)|答案(1)|浏览(82)

我正在使用MobileNet训练一组图像,它可以进行多类分类。训练后的损失时期曲线看起来像这样:

我不知道如何解释这一点,如果这是足够好/可接受的?但最后有一些尖峰,所以我假设这不是很好?如何改善这一点?

ie3xauqp

ie3xauqp1#

模型收敛时出现峰值是一种常见的现象。这个问题可以在许多CNN或基于transformer的分类模型中观察到,例如“ResNet”论文中的图。

您可能还注意到,许多损失曲线看起来非常平滑;这是因为它们采用“移动平均”来呈现更平滑的损失曲线。
因此,我建议训练更多的epoch来观察损失曲线的变化,或者选择一个较小的学习率。此外,您可以利用检查点来保存具有最低验证损失的模型。

相关问题