“无法初始化NVML:驱动程序/库版本不匹配”-Ubuntu服务器是否自动更新?

nwo49xxi  于 2023-04-20  发布在  其他
关注(0)|答案(2)|浏览(138)

我在Ubuntu服务器上收到了这条消息:

Failed to initialize NVML: Driver/library version mismatch

打字时

watch nvidia-smi

我正在运行Ubuntu服务器(Ubuntu 18.04.5 LTS),昨天一切正常。
那么问题来了,ubuntu服务器是否在没有征求我的许可的情况下自动更新了Nvidia驱动程序?我如何确认这一点?我不想要自动更新!
我意识到重新启动可以解决这个问题,但这是服务器做很多其他的事情,所以在一周中重新启动是不允许的:)
谢谢!

wz3gfoph

wz3gfoph1#

我也遇到过同样的问题。我通过以下方法解决了这个问题:1〉使用命令检查nvidia-driver的版本:cat /proc/driver/nvidia/version 2〉检查驱动程序是否已升级:cat /var/log/dpkg.log|grep nvidia 3〉在我的计算机中,它已从415升级到418。4〉需要重新安装nvidia-driver并使用命令apt mark nvidia-415保持版本

d5vmydt9

d5vmydt92#

我得到了同样的问题,并通过安装正确的GPU驱动程序解决了它。
需要安装cuda toolkit和cudnn,具体请参考官方doc,驱动会自动安装。
注意:最新版本是12.1,可能与最新的torch不兼容,您必须自己构建它。
或者您需要安装11.x版本。

相关问题