我正在分析我的tensorflow应用程序。训练运行良好,但如果我在Tensorboard中打开Profile-Tab,则会得到Failed to load libcupti (is it installed and accessible?)
。
我的配置为:
- Windows 10操作系统
- 简体中文
- Tensorflow 2.6.0
- CUDA工具包11.2
- cuDNN 8.1.1(通过复制所述文件安装为here)
- Visual Studio专业版2019
CUDA_PATH
是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2
我的路径变量包含:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin
个C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\libnvvp
个C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
个C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\include
个C:\Program Files\NVIDIA Corporation\Nsight Systems 2020.4.3\target-windows-x64
个
conda list
(仅相关软件包):
cudatoolkit 11.3.1 h59b6b97_2
cudnn 8.2.1 cuda11.3_0
tensorboard 2.6.0 py_1
tensorboard-data-server 0.6.0 py39haa95532_0
tensorboard-plugin-profile 2.5.0 pypi_0 pypi
tensorboard-plugin-wit 1.6.0 py_0
tensorflow 2.6.0 gpu_py39he88c5ba_0
tensorflow-base 2.6.0 gpu_py39hb3da07e_0
tensorflow-datasets 4.5.2 pypi_0 pypi
tensorflow-estimator 2.6.0 pyh7b7c402_0
tensorflow-gpu 2.6.0 h17022bd_0
tensorflow-metadata 1.6.0 pypi_0 pypi
字符串
我很惊讶Anaconda已经安装了CUDA Toolkit版本11.3和cuDNN版本8.2.1。根据GPU配置,这应该是版本11.2和8.1。这会是问题所在吗?
或者有人知道如何解决这个问题吗?
1条答案
按热度按时间juzqafwq1#
隐藏在jupyter的日志输出中,我发现了一条错误消息:
Could not load dynamic library 'cupti64_113.dll': dlerror: cupti64_113.dll not found
(此日志可以在终端中找到,其中运行jupyter。通过这个错误消息和github问题,我能够解决这个问题:我在
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\CUPTI\lib64
中复制了cupti64_2020.3.0.dll
,并将其重命名为cupti64_113.dll
,现在分析器可以工作了。