问题:

机器已经安装nvidia驱动,且正常使用,重启后找不到显卡驱动

打开终端,用nvidia-smi查看一下,发现如下报错:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. 
Make sure that the latest NVIDIA driver is installed and running.

分析:

查看发现系统中的显卡驱动自动升级了,重启后没有正常找到驱动

解决:

第一步,使用nvcc -V检查驱动和cuda。

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Mar_21_19:15:46_PDT_2021
Cuda compilation tools, release 11.3, V11.3.58
Build cuda_11.3.r11.3/compiler.29745058_0

发现驱动是存在的,于是进行下一步

第二步,查看已安装驱动的版本信息

ls /usr/src | grep nvidia

比如我的驱动版本是:nvidia-545.23.08

第三步,依次输入以下命令

sudo apt-get install dkms

sudo dkms install -m nvidia -v 545.23.08

等待安装完成后,再次输入nvidia-smi,查看GPU使用状态:

最后,我们熟悉的页面又回来了!

第四步,本来到这就结束了,但发现显卡没被占用,但利用率却有:

问题:

执行以下命令,解决

sudo nvidia-smi -pm 1

参考:

1、NVIDIA驱动失效简单解决方案:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver._nvidia-smi has failed because it couldn't communic-CSDN博客

2、未运行任何程序,GPU使用率却居高不下(接近100%)_将驱动模式设置为常驻内存-CSDN博客

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐