Paddle 同样docker容器,同样的代码3090/4070显卡报错,V100/A100训练成功

vngu2lb8  于 2个月前  发布在  Docker
关注(0)|答案(2)|浏览(37)

bug描述 Describe the Bug

https://github.com/yeyupiaoling/AudioClassification-PaddlePaddle 这个工程,在V100显卡机器按照相关的依赖安装,训练成功后,打包成docker;commit docker image导出到另外一台4070显卡机器,同样的样本,同样的参数运行会报cuda错误。各种库依赖详见: https://github.com/yeyupiaoling/AudioClassification-PaddlePaddle

其他补充信息 Additional Supplementary Information

No response

tf7tbtn2

tf7tbtn21#

期间尝试过升级paddle版本、cuda版本和直接用docker hub上面的2.6.1-gpu-cuda11.7-cudnn8.4-trt8.4和2.4.2-gpu-cuda10.2-cudnn7.6-trt7.0以及2.4.2-gpu-cuda10.2-cudnn7.6-trt7.0搭建过环境,在4070上各种cuda的错误。

72qzrwbm

72qzrwbm2#

您好,该repo并非paddle官方开源项目。NVIDIA的不同GPU型号通常需要不同版本的CUDA和GPU驱动来支持。4070上需要安装对应其cuda版本的paddle。

相关问题