我尝试在安装docker-ce后安装nvidia-docker,我遵循了以下步骤:https://github.com/NVIDIA/nvidia-docker来安装nvidia-docker。它似乎安装正确。
我试着逃跑:
$ sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
docker: Error response from daemon: Unknown runtime specified nvidia.
See 'docker run --help'.
不过,这是可行的(没有--runtime=nvidia):
$ docker container run -ti ubuntu bash
关于我的系统的一些附加信息:这是一个ubuntu服务器16.04与8个GPU(泰坦Xp)和nvidia驱动程序版本387.26。我可以运行nvidia-smi -l 1在主机系统上,它的工作与预期的。
$ dpkg -l | grep -E '(nvidia|docker)'
ii docker-ce 18.06.1~ce~3-0~ubuntu amd64 Docker: the open-source application container engine
ii libnvidia-container-tools 1.0.0-1 amd64 NVIDIA container runtime library (command-line tools)
ii libnvidia-container1:amd64 1.0.0-1 amd64 NVIDIA container runtime library
ii nvidia-container-runtime 2.0.0+docker18.06.1-1 amd64 NVIDIA container runtime
ii nvidia-container-runtime-hook 1.4.0-1 amd64 NVIDIA container runtime hook
ii nvidia-docker2 2.0.3+docker18.06.1-1 all nvidia-docker CLI wrapper
$ cat /etc/docker/daemon.json
{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
}
}
我遇到过:https://github.com/NVIDIA/nvidia-docker/issues/501,但我不知道该如何着手。
7条答案
按热度按时间lf3rwulv1#
来自英伟达-Docker Github回购:
zbq4xfa02#
实际上,您可以尝试通过以下命令重新启动Docker守护进程。
或者你可以尝试重新启动你的系统。以使nvidia-docker工作
soat7uwm3#
这就是我如何解决CentOS 7的上述问题;希望它能帮助任何有类似问题的人。
路径为nvidia-container-runtime:
oaxa6hgo4#
看起来你可能需要清除Docker并重新安装它,就像在帖子中一样:github问题
lx0bsm1f5#
常见问题解答:
为什么我会得到错误
Unknown runtime specified nvidia
?请确保运行时已注册到dockerd
。您还需要重新加载Docker守护进程的配置。ipakzgxi6#
如果你在安装nvidia-docker时遇到问题,那就试试运行这个shell script吧,它甚至在nvidia-docker崩溃时也能正常工作。
wr98u20j7#
将 --runtime=nvidia 标记更改为 *--runtine= gpusall *,希望它能够运行