Paddle fleet分布式训练使用fluid.layers.collective._c_allgather程序hang住,GPU利用率固定在100%,没有输出

gz5pxeao  于 2021-12-07  发布在  Java
关注(0)|答案(1)|浏览(333)

 1)PaddlePaddle版本:1.8.3
   3)GPU:32g V100、CUDA 10.1、 CUDNN 7.6
   3)Python3.7.4

程序hang住不动,不使用fluid.layers.collective._c_allgather可正常运行

3okqufwl

3okqufwl1#

您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网API文档常见问题历史IssueAI社区来寻求解答。祝您生活愉快~

Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the APIFAQGithub Issue and AI community to get the answer.Have a nice day!

相关问题