在一个计算机集群中,我有一个计算节点的IP地址。这个计算节点在Slurm配置中有一个名称。我如何找到Slurm为这个计算节点使用的名称?
abithluo1#
slurm.conf中的节点名称必须与hostname -s命令返回的主机名相对应,并且Slurm希望这些名称解析为正确的IP。所以你应该能跑
slurm.conf
hostname -s
getent hosts <IP>
得到类似于
$ getent hosts 10.1.1.1 10.1.1.1 node001.cluster
在上面的示例中,Slurm已知的节点名为node001,您可以使用scontrol show node node001确认。
node001
scontrol show node node001
1条答案
按热度按时间abithluo1#
slurm.conf
中的节点名称必须与hostname -s
命令返回的主机名相对应,并且Slurm希望这些名称解析为正确的IP。所以你应该能跑
得到类似于
在上面的示例中,Slurm已知的节点名为
node001
,您可以使用scontrol show node node001
确认。