paddlepaddle-gpu环境安装

安装

  1. 进入官方网站查找安装命令
https://www.paddlepaddle.org.cn/install/old?docurl=/documentation/docs/zh/install/pip/linux-pip.html
  1. 选择稳定版本,及Linux安装方式
# 以V2.3为例,cuda 11.6,cudnn 8.4.0,多卡环境下nccl>=2.7
conda install paddlepaddle-gpu==2.3.2 cudatoolkit=11.6 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/ -c conda-forge
  1. 使用conda安装paddlepaddle-gpu,不要使用pip安装,pip无法成功安装cudatoolkit!

paddlepaddle-gpu踩坑指北:

  1. 除paddlepaddle-gpu外,还需要安装paddlepaddle-cpu,否则会报缺少paddle.batch,paddle.io等错误;
# paddlepaddle-cpu应安装与paddlepaddle-gpu相同的版本
conda install paddlepaddle==2.3.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/
  1. 在安装paddle前,需要安装以下依赖;
pip install common
pip install dual
pip install tight
pip install data
pip install prox
pip install paddle
  1. tqdm版本问题
# 使用以下版本
pip install tqdm==4.64.1
  1. 出现libcudart.so.11.0找不到的情况
# 错误信息,找不到该文件
libcudart.so.11.0: cannot open shared object file: No such file or directory
# 解决办法,手动链接该文件
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/zhangxd/miniconda3/envs/env_name/lib/
# 文件路径
一般在conda环境下的lib文件夹下,如果找不到,可以用find命令进行查找
  1. pip “解释器错误,没有那个文件或目录”
# 原因,由于conda环境是迁移过来的,配置该环境的服务器路径与当前服务器路径不一致,所以找不到路径,修改该环境bin目录下的pip文件即可
vim /home/zhangxd/miniconda3/envs/env_name/bin/pip

# 将pip文件中第一行路径修改为正确路径,该行的“#”不起注释作用
/home/zhangxd/miniconda3/envs/env_name/bin/python
  1. 混合精度训练适用的 NVIDIA GPU 计算能力至少为 7.0 的版本。此外如果已开启自动混合精度训练,飞桨框架会自动检测硬件环境是否符合要求,如不符合则将提供类似如下的警告信息:UserWarning: AMP only support NVIDIA GPU with Compute Capability 7.0 or higher, current GPU is: Tesla K40m, with Compute Capability: 3.5.。
# 官方说明文档地址
https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/performance_improving/amp_cn.html

必须使用支持AMP计算方式的显卡进行计算,比如NVIDIA系列的显卡。在官网文档1.3 支持硬件说明中可以看到如下信息:

硬件支持的混合精度
Nvidia GPUfloat16 bfloat16
Intel CPUbfloat16
华为 NPUfloat16
昆仑芯 XPUfloat16
寒武纪 MLUfloat16

7.在环境配置途中,还会出现提示缺少的包名与安装包名不一致的情况,包版本不适用的情况

# 列出部分例子
yaml
pip install pyyaml

Levenshtein
pip install python-Levenshtein

protobuf版本问题
protobuf==3.20.x

...

最后,在配置环境时,建议每一个依赖包都要下载下来,以便后续迁移、补充

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐