有时,我的CUDA程序中的错误会导致桌面图形中断(在Windows中)。通常,屏幕仍保持一定的可读性,但当图形发生变化时,例如拖动窗口时,会出现大量半随机颜色的像素和小块。我试过通过改变桌面分辨率来重置GPU和驱动程序,但没有用。我找到的唯一修复方法是重新启动计算机。有没有一个程序在那里或一些技巧,我可以用来让驱动程序和GPU重置而不重新启动?
taor4pac1#
因为同样的问题有时会发生在unix和谷歌转发我到这个线程,我希望这有助于别人...在ubuntu上卸载和重新加载nvidia内核模块为我解决了这个问题:
sudo rmmod nvidia_uvm sudo modprobe nvidia_uvm
a6b3iqyw2#
编辑:
如果您使用Linux上的Tesla硬件,并且可以运行nvidia-smi,则可以使用
nvidia-smi -r
或
nvidia-smi --gpu-reset
以下是此开关的man输出:重置GPU状态。可用于清除双位ECC错误或恢复挂起的GPU。需要-i开关才能将特定设备作为目标。仅在Linux上可用。否则......真正重置硬件的方法是重新启动。您描述的情况不应该发生。我建议您使用不同的硬件进行测试,如果仍然发生,请告诉我们。
man
zvms9eto3#
要在Windows中重置图形堆栈,请按Win+Ctrl+Shift+B。
ovfsdjhp4#
我有一个GeForce GTX 260在NVDIA GPU SDK 4.2和我遇到了一些问题。有时开发我有程序错误。这导致屏幕显示随机彩色像素描述在这篇文章。正如这里所述,如果我改变分辨率,它们不会消失。而且,如果我只改变颜色深度从32位到16位,随机颜色像素消失,但回到32位(不重新启动)使它们再次出现。最后一个导致这种行为的bug是使用__constant__ memory,但将其作为指针传递:
test<<<grid, threadsPerBlock>>>( cuda_malloc_data, cuda_constant_data );
如果我没有传递cudb_constant_data,那么就没有bug(因此,随机彩色像素不会出现)。
cudb_constant_data
vof42yt15#
1.在“设备管理器”的"显示适配器“选项卡下,找到驱动程序1.禁用它1.按win + ctrl +shift + B(监视器将闪烁)1.启用驱动程序给你。
8yparm6h6#
ps -ef
root 4066644 1 99 08:56 ? 04:32:25 /opt/conda/bin/python /data/
kill 4066644
6条答案
按热度按时间taor4pac1#
因为同样的问题有时会发生在unix和谷歌转发我到这个线程,我希望这有助于别人...
在ubuntu上卸载和重新加载nvidia内核模块为我解决了这个问题:
a6b3iqyw2#
编辑:
如果您使用Linux上的Tesla硬件,并且可以运行nvidia-smi,则可以使用
或
以下是此开关的
man
输出:重置GPU状态。可用于清除双位ECC错误或恢复挂起的GPU。需要-i开关才能将特定设备作为目标。仅在Linux上可用。
否则......
真正重置硬件的方法是重新启动。
您描述的情况不应该发生。我建议您使用不同的硬件进行测试,如果仍然发生,请告诉我们。
zvms9eto3#
要在Windows中重置图形堆栈,请按Win+Ctrl+Shift+B。
ovfsdjhp4#
我有一个GeForce GTX 260在NVDIA GPU SDK 4.2和我遇到了一些问题。有时开发我有程序错误。这导致屏幕显示随机彩色像素描述在这篇文章。
正如这里所述,如果我改变分辨率,它们不会消失。而且,如果我只改变颜色深度从32位到16位,随机颜色像素消失,但回到32位(不重新启动)使它们再次出现。最后一个导致这种行为的bug是使用__constant__ memory,但将其作为指针传递:
如果我没有传递
cudb_constant_data
,那么就没有bug(因此,随机彩色像素不会出现)。vof42yt15#
1.在“设备管理器”的"显示适配器“选项卡下,找到驱动程序
1.禁用它
1.按win + ctrl +shift + B(监视器将闪烁)
1.启用驱动程序
给你。
8yparm6h6#
ps -ef
1.找到类似
root 4066644 1 99 08:56 ? 04:32:25 /opt/conda/bin/python /data/
的内容kill 4066644