更新nvidia-container-toolkit 1.17.7-1后,运行--gpus all 卡死问题
在使用Arch Linux时,尝试通过sudo docker run -it --runtime=nvidia --gpus all命令运行Docker容器时遇到系统卡死问题。经过数小时的排查,发现问题的根源在于nvidia-container-toolkit的1.17.7-1版本存在缺陷,该问题在Ubuntu和Arch系统上均有出现。解决方法是降级到1.17.6版本,通过执行sudo downg
·
用Arch每日一滚,结果今天用 sudo docker run -it --runtime=nvidia --gpus all居然卡死了,排雷排了几小时,才从开源库发现问题

nvidia-container-toolkit 1.17.7-1 是有问题的,而且在ubuntu和arch上都存在问题。
只好Downgrade 1.17.6的版本
sudo downgrade nvidia-container-toolkit libnvidia-container
正常运行即可,建议和我一起持续关注issue变化。
更多推荐
所有评论(0)