Chinese-CLIP Windows单机单卡训练报错:RuntimeError:分布式包中没有内置NCCL,

plicqrtu  于 2个月前  发布在  Windows
关注(0)|答案(2)|浏览(34)

RuntimeError: Distributed package doesn't have NCCL built in

jtw3ybtb

jtw3ybtb1#

EOFError: 输入结束
错误:torch.distributed.elastic.multiprocessing.api:失败(退出代码:1) local_rank: 0 (pid: 27316) of二进制文件:C:\anaconda\envs\clip\python.exe

sbtkgmzw

sbtkgmzw2#

\n\n您好,可能是因为Windows系统不支持NCCL分布式后端。您可以参考 #57 (comment) 尝试将分布式后端设置为gloo看看,更建议在Linux系统训练。

相关问题