我在ubuntu上运行mesos并尝试执行:
mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--docker_image=nvidia/cuda \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"
它之所以失败是因为: sh: 1: nvidia-smi: not found
即使我在没有容器支持的情况下运行它
mesos-execute \
--master=$(cat /etc/mesos/zk) \
--name=gpu-test \
--command="nvidia-smi" \
--framework_capabilities="GPU_RESOURCES" \
--resources="gpus:1"
它可以访问gpu
另外,如果我在没有容器支持的情况下运行它,但是将命令 nvidia-docker run -it nvidia/cuda nvidia-smi
它的工作,所以看来,mesos集装箱船没有访问GPU。但是在 /etc/mesos-slave/
我给它的目录containerizers mesos(以及运行gpu命令所需的所有其他标志)。加上非gpu相关的命令工作良好。
1条答案
按热度按时间2w2cym1i1#
这看起来像是1.3.0中的回归。我在ubuntu上降级到了1.2.1,可以再次成功地将gpu与docker容器和mesos容器器结合使用。
看起来有人提交了一个相关的bug,但没有任何活动:
https://issues.apache.org/jira/browse/mesos-7730