本文记录在 RTX 50 系列(Blackwell架构) 设备上,从零配置深度学习环境的完整过程,并总结关键问题与解决方案,供同类环境参考。


一、硬件与目标环境

硬件信息:

nvidia-smi

输出:

GPU: NVIDIA GeForce RTX 5060 Laptop GPU
Driver Version: 577.03
CUDA Version: 12.9

设备计算能力:

import torch
torch.cuda.get_device_capability()

结果:

(12, 0)

说明:

  • 架构:Blackwell

  • Compute Capability:sm_120


二、环境方案选择

可选方案对比:

方案 特点
Windows原生 依赖复杂,兼容性一般
双系统 成本高,切换不便
虚拟机 无GPU直通
WSL2 GPU直通,接近Linux性能

最终选择:

WSL2 + Ubuntu + Conda

安装:

wsl --install

若网络问题导致失败,可手动下载安装发行版。


三、关键问题:no kernel image 报错

初始安装:

pip install torch torchvision torchaudio

测试:

import torch
x = torch.tensor([1.0]).cuda()

报错:

RuntimeError: CUDA error: no kernel image is available for execution on the device

同时提示:

sm_120 is not compatible with the current PyTorch installation

原因

RTX 50 系列属于 Blackwell架构(sm_120)

而旧版 PyTorch:

  • 仅编译到 sm_90(Ada)

  • 不包含 Blackwell kernel

结论

必须使用:

PyTorch 2.8 + cu128


四、正确环境配置流程

1. 创建独立环境

conda create -n d2l python=3.9
conda activate d2l

确认环境:

which python

应包含:

.../envs/d2l/bin/python

2. 安装支持Blackwell的PyTorch

pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 \
--index-url https://download.pytorch.org/whl/cu128

版本必须对应:

版本
torch 2.8.0
torchvision 0.23.0
torchaudio 2.8.0

3. GPU测试

import torch

print(torch.__version__)
print(torch.cuda.is_available())
print(torch.cuda.get_device_name(0))

x = torch.tensor([1.0, 2.0]).cuda()
y = x * 2 + 3
print(y)

输出示例:

2.8.0+cu128
True
RTX 5060 Laptop GPU
tensor([5., 7.], device='cuda:0')

五、JupyterLab环境配置

1. 安装

pip install jupyterlab ipykernel

2. 注册环境内核

python -m ipykernel install --user --name d2l --display-name "Python (d2l)"

3. 启动

建议在Linux目录下运行:

cd ~
mkdir jupyter_workspace
cd jupyter_workspace
jupyter lab

避免在:

/mnt/c/windows/system32

否则可能出现权限问题。


4. 选择正确内核

Notebook右上角选择:

Python (d2l)

否则可能出现:

ModuleNotFoundError: No module named 'torch'

六、最终验证:模型部署GPU

import torch
import torch.nn as nn

model = nn.Linear(10, 1).cuda()

print(next(model.parameters()).is_cuda)

输出:

True

同时可监控GPU:

watch -n 1 nvidia-smi

七、环境最终状态

项目 配置
系统 WSL2 + Ubuntu
Python Conda环境 d2l
PyTorch 2.8.0+cu128
CUDA驱动 12.9
GPU RTX 5060
IDE JupyterLab
工作目录 ~/jupyter_workspace

八、常见问题总结

1. no kernel image

原因:PyTorch版本不支持sm_120
解决:安装2.8.0+cu128


2. Jupyter找不到torch

原因:内核错误
解决:选择Python(d2l)


3. 环境混用

检查:

which python
conda info --envs

4. 权限问题

避免在:

/mnt/c/

目录运行Jupyter。


九、RTX 50系列配置建议

如果使用Blackwell架构GPU:

直接安装:

pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 \
--index-url https://download.pytorch.org/whl/cu128

避免在旧版本上调试。


十、一键脚本

#!/bin/bash

conda create -n d2l python=3.9 -y
conda activate d2l

pip install torch==2.8.0 torchvision==0.23.0 torchaudio==2.8.0 \
--index-url https://download.pytorch.org/whl/cu128

pip install jupyterlab ipykernel

python -m ipykernel install --user --name d2l --display-name "Python (d2l)"

mkdir -p ~/jupyter_workspace

运行:

bash setup_d2l.sh
Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐