paddlepaddle-gpu环境安装
paddlepaddle-gpu环境安装
·
paddlepaddle-gpu环境安装
安装
- 进入官方网站查找安装命令
https://www.paddlepaddle.org.cn/install/old?docurl=/documentation/docs/zh/install/pip/linux-pip.html
- 选择稳定版本,及Linux安装方式
# 以V2.3为例,cuda 11.6,cudnn 8.4.0,多卡环境下nccl>=2.7
conda install paddlepaddle-gpu==2.3.2 cudatoolkit=11.6 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge
- 使用conda安装paddlepaddle-gpu,不要使用pip安装,pip无法成功安装cudatoolkit!
paddlepaddle-gpu踩坑指北:
- 除paddlepaddle-gpu外,还需要安装paddlepaddle-cpu,否则会报缺少paddle.batch,paddle.io等错误;
# paddlepaddle-cpu应安装与paddlepaddle-gpu相同的版本
conda install paddlepaddle==2.3.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/
- 在安装paddle前,需要安装以下依赖;
pip install common
pip install dual
pip install tight
pip install data
pip install prox
pip install paddle
- tqdm版本问题
# 使用以下版本
pip install tqdm==4.64.1
- 出现libcudart.so.11.0找不到的情况
# 错误信息,找不到该文件
libcudart.so.11.0: cannot open shared object file: No such file or directory
# 解决办法,手动链接该文件
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/zhangxd/miniconda3/envs/env_name/lib/
# 文件路径
一般在conda环境下的lib文件夹下,如果找不到,可以用find命令进行查找
- pip “解释器错误,没有那个文件或目录”
# 原因,由于conda环境是迁移过来的,配置该环境的服务器路径与当前服务器路径不一致,所以找不到路径,修改该环境bin目录下的pip文件即可
vim /home/zhangxd/miniconda3/envs/env_name/bin/pip
# 将pip文件中第一行路径修改为正确路径,该行的“#”不起注释作用
/home/zhangxd/miniconda3/envs/env_name/bin/python
- 混合精度训练适用的 NVIDIA GPU 计算能力至少为 7.0 的版本。此外如果已开启自动混合精度训练,飞桨框架会自动检测硬件环境是否符合要求,如不符合则将提供类似如下的警告信息:UserWarning: AMP only support NVIDIA GPU with Compute Capability 7.0 or higher, current GPU is: Tesla K40m, with Compute Capability: 3.5.。
# 官方说明文档地址
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/performance_improving/amp_cn.html
必须使用支持AMP计算方式的显卡进行计算,比如NVIDIA系列的显卡。在官网文档1.3 支持硬件说明中可以看到如下信息:
硬件 | 支持的混合精度 |
---|---|
Nvidia GPU | float16 bfloat16 |
Intel CPU | bfloat16 |
华为 NPU | float16 |
昆仑芯 XPU | float16 |
寒武纪 MLU | float16 |
7.在环境配置途中,还会出现提示缺少的包名与安装包名不一致的情况,包版本不适用的情况
# 列出部分例子
yaml
pip install pyyaml
Levenshtein
pip install python-Levenshtein
protobuf版本问题
protobuf==3.20.x
...
最后,在配置环境时,建议每一个依赖包都要下载下来,以便后续迁移、补充
更多推荐
已为社区贡献1条内容
所有评论(0)