无法使用gpu任务运行mesos容器

dgjrabp2  于 2021-06-26  发布在  Mesos
关注(0)|答案(1)|浏览(435)

我在ubuntu上运行mesos并尝试执行:

mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--docker_image=nvidia/cuda \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"

它之所以失败是因为: sh: 1: nvidia-smi: not found 即使我在没有容器支持的情况下运行它

mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"

它可以访问gpu
另外,如果我在没有容器支持的情况下运行它,但是将命令 nvidia-docker run -it nvidia/cuda nvidia-smi 它的工作,所以看来,mesos集装箱船没有访问GPU。但是在 /etc/mesos-slave/ 我给它的目录containerizers mesos(以及运行gpu命令所需的所有其他标志)。加上非gpu相关的命令工作良好。

2w2cym1i

2w2cym1i1#

这看起来像是1.3.0中的回归。我在ubuntu上降级到了1.2.1,可以再次成功地将gpu与docker容器和mesos容器器结合使用。

sudo apt-get install mesos=1.2.1-2.0.1

看起来有人提交了一个相关的bug,但没有任何活动:
https://issues.apache.org/jira/browse/mesos-7730

相关问题