Paddle ExternalError: Cuda error(700), an illegal memory access was encountered.

jdgnovmf  于 2021-11-30  发布在  Java
关注(0)|答案(5)|浏览(1199)
  • 版本、环境信息:

   1)PaddlePaddle版本:2.1.2
   2)CPU:无
   3)GPU:Tesla V100-SXM2 CUDA Version: 11.2
   4)系统环境:Linux,Python3.7
以上信息。

  • 训练信息

   1)单机 单卡
   2)显存信息
   3)Operator信息

  • 复现信息:如为报错,请给出复现环境、复现步骤

执行https://github.com/leeyy2020/EFL_en_baseline
中的rdrop分支训练脚本即会报错

  • 问题描述:请详细描述您的问题,同步贴出报错信息、日志、可复现的代码片段

hpcdzsge

hpcdzsge1#

您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网API文档常见问题历史IssueAI社区来寻求解答。祝您生活愉快~

Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the APIFAQGithub Issue and AI community to get the answer.Have a nice day!

x7rlezfr

x7rlezfr2#

是否是预处理里的data augment把哪个数据的shape踩到0了

czq61nw1

czq61nw13#

bug出现之后gpu会呈现这样的状态

wvmv3b1j

wvmv3b1j4#

看报错是踩显存了,一般是因为tensor的shape不合法,可以打印一下tensor的shape看下

相关问题