我正在运行深度学习代码。
我的电脑很差,所以我使用pycharm,它通过ssh连接远程服务器。
问题来了:
默认服务器环境未连接到gpu
我需要像这样使用commond salloc --cpus-per-task=4 --gres=gpu:tesla_v100-pcie-32gb:1 -t 20:0:0
进入一个连接到gpu的新环境。
当我在pycharm中按run或debug时,它将启动一个新的ssh连接,进入不连接到gpu的默认环境。运行按钮和调试按钮
我所知道的是:我可以使用终端salloc,然后使用commond python xx.py
运行脚本。但我真正想要的是使用pycharm的出色调试功能
我试过的方法如下:
我试着用 os.system("salloc --cpus-per-task=4 --gres=gpu:tesla_v100-pcie-32gb:1 -t 20:0:0")
在python脚本的开头。但不幸的是,该程序在执行此命令后卡住,并进入由 salloc
按Run键后的代码结果程序没有停止
我假设在操作1之后,ssh连接应该在salloced会话上。因此,我对操作系统代码进行了注解,然后停止并重新运行。它失败了。也许pycharm会将ssh重新连接到默认环境,而默认环境不会连接到gpu。重新运行后,我修改的coderesult
这里是我的最后一个问题:如何让pycharm使用一些命令首先在ssh服务器上对环境进行salloc,然后运行或调试我的代码?
类似的讨论可以在这里找到:使用srun在集群上运行远程解释器
暂无答案!
目前还没有任何答案,快来回答吧!