pytorch 如何减少训练和验证在损失曲线上的差异？

vmdwslir 于 2022-11-09 发布在其他

关注(0)|答案(1)|浏览(150)

我已经使用Transformer模型来训练时间序列数据集，但是在我的损失曲线中，训练和验证之间总是存在差距。我尝试使用不同的学习率、批大小、辍学、头、dim_feedforward和层，但是它们都不起作用。有人能给予我一些关于减少它们之间差距的想法吗？

我也试着在Pytorch论坛上问这个问题，但没有得到任何回复。How to design a decoder for time series regression in Transformer?

来源：https://stackoverflow.com/questions/74021838/how-to-reduce-the-difference-between-training-and-validation-in-the-loss-curve

1条答案

按热度按时间

由于您在此处过度拟合模型1.尝试使用更多数据2.尝试添加dropOut图层3.尝试使用套索或山脊

赞(0）回复(0）举报 2022-11-09

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 3个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 3个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 3个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 3个月前