我在Ubuntu服务器上收到了这条消息:
Failed to initialize NVML: Driver/library version mismatch
打字时
watch nvidia-smi
我正在运行Ubuntu服务器(Ubuntu 18.04.5 LTS),昨天一切正常。
那么问题来了,ubuntu服务器是否在没有征求我的许可的情况下自动更新了Nvidia驱动程序?我如何确认这一点?我不想要自动更新!
我意识到重新启动可以解决这个问题,但这是服务器做很多其他的事情,所以在一周中重新启动是不允许的:)
谢谢!
2条答案
按热度按时间wz3gfoph1#
我也遇到过同样的问题。我通过以下方法解决了这个问题:1〉使用命令检查nvidia-driver的版本:
cat /proc/driver/nvidia/version
2〉检查驱动程序是否已升级:cat /var/log/dpkg.log|grep nvidia
3〉在我的计算机中,它已从415升级到418。4〉需要重新安装nvidia-driver并使用命令apt mark nvidia-415
保持版本d5vmydt92#
我得到了同样的问题,并通过安装正确的GPU驱动程序解决了它。
需要安装cuda toolkit和cudnn,具体请参考官方doc,驱动会自动安装。
注意:最新版本是12.1,可能与最新的torch不兼容,您必须自己构建它。
或者您需要安装11.x版本。