从错误信息来看,问题出在无法找到libcudart.so.11.0
这个共享库文件。这可能是因为你的系统中安装的CUDA版本与vllm所需的版本不匹配。你提到使用nvidia/cuda:12.1.0-devel-ubuntu22.04
应该不会出现问题,但实际上它需要的是CUDA 11.8。
要解决这个问题,你可以尝试在Dockerfile中指定安装CUDA 11.8。首先,你需要创建一个名为Dockerfile.gpu118
的新文件,然后在其中添加以下内容:
FROM nvidia/cuda:11.8.0-devel-ubuntu22.04
# 其他Dockerfile指令
接下来,确保在构建镜像时使用新创建的Dockerfile.gpu118
文件。例如,如果你之前使用的是Dockerfile
,现在应该使用docker build --file Dockerfile.gpu118 -t your_image_name .
命令来构建镜像。
这样,你的镜像将基于CUDA 11.8进行构建,应该可以解决找不到libcudart.so.11.0
的问题。
2条答案
按热度按时间mdfafbf11#
Have you try this? https://docs.vllm.ai/en/latest/getting_started/installation.html
relj7zay2#
我不得不切换到13.0的base cupy/cupy docker镜像,然后安装vllm,它将cupy安装降级到正确的版本。