深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置


RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置

  • 一、驱动及cuda、cudnn的安装
  • 二、pytorch的安装
    • 1. 源码编译安装
    • 2. pip方式安装
  • 三、TensorFlow的安装
    • ※ nvidia-tensorflow==1.15.4+nv20.10版本的安装
      • 1. 安装 TensorFlow wheel的索引
      • 2. 安装TensorFlow
      • 3. 安装nvidia-TensorFlow对应的依赖包
      • 4. TensorFlow测试
  • 四、后记
  • 参考

有幸公司给购买了RTX3080,可以上手试试,但是发现环境的配置是个头大的问题,且由于项目的关系,至今TensorFlow的版本至今仍是1.x的版本,所以得考虑TensorFlow的具体版本对应,还有pytorch的适配。最终经过各方资料的查找与尝试,终于安装完成,安装好的驱动及各版本如下。
Ubuntu:18.04.5
cuda:11.1
cudnn:8.0.4.30
TensorFlow:1.15.4
pytorch:1.7.0
首先分享安装所有库的网盘链接:
网址:https://pan.baidu.com/s/1j6XSG8oyBX6lzHzka7xr3Q;
提取密码:5tgm

一、驱动及cuda、cudnn的安装 RTX3080采用了新的Ampere架构GA102-200,那么显卡驱动也必然是需要最新的,可以参考cuda与驱动对应的关系:
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

我们安装的是455.23.04版本,CUDA是11.1版本,cudnn是8.0.4.30版本,具体的安装方法可参考一下网址。
ubuntu16.04系统run方式安装nvidia显卡驱动
Ubuntu16.04下cuda和cudnn的卸载和升级
方法都是大同小异,最后输入nvidia-smi确认驱动是否安装好,nvcc --version确认是否安装好cuda。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

二、pytorch的安装 1. 源码编译安装 pytorch的安装相对简单一些,可以选择源码编译安装,也可以选择直接pip的方式安装。由于我的网络实在不好,每次在拉源码的时候都会报错,就放弃了。。依赖库真的太难下载了。具体的源码编译方式可参考下面的方法。
RTX3080/RTX3090驱动安装CUDA11.1+CUDNN8.0.4.30+pytorch源码编译
Pytorch源码编译简明指南
2. pip方式安装 进入pytorch官网,可以看到下载方式,命令:
pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

也可以进入下载的网站,直接点击下载,然后再通过安装whl的方式进行安装pytorch。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

安装完的结果如下图。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

安装完再进行测试,版本以及cuda是否可用。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

三、TensorFlow的安装 【深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置】如果没有版本的硬性要求,甚至可以直接通过安装tf-nightly的版本,那就很方便了,直接通过命令:
pip install tf-nightly-gpu

就可以安装好了,对应版本是2.4+。
※ nvidia-tensorflow==1.15.4+nv20.10版本的安装 经过大量资料的查找,得知TensorFlow官方是已经放弃了1.x的版本更新,那么还有没有还在更新的TensorFlow1.x版本呢?答案是有,终于被我们找到了,参考Accelerating TensorFlow on NVIDIA A100 GPUs。这是nvdia官方对也是安培架构的A100 GPU进行编译的TensorFlow 1.15版本,进行了简单介绍以及安装方法,这对同样是安培架构的3080也是通用的。
具体安装方法简介如下:
1. 安装 TensorFlow wheel的索引
pip install nvidia-pyindex

2. 安装TensorFlow
pip install nvidia-tensorflow

大概率是会安装报错,有许多个依赖包,且有些包比较大,如果是不能科学上网的话,很难一次性安装成功。那么优先安装依赖包。
3. 安装nvidia-TensorFlow对应的依赖包
具体依赖包有下:
nvidia-cublas11.2.1.74 nvidia-cuda-cupti11.1.69 nvidia-cuda-nvcc11.1.74 nvidia-cuda-nvrtc11.1.74 nvidia-cuda-runtime11.1.74 nvidia-cudnn8.0.4.30 nvidia-cufft10.3.0.74 nvidia-curand10.2.2.74 nvidia-cusolver11.0.0.74 nvidia-cusparse11.2.0.275 nvidia-dali-cuda1100.26.0 nvidia-dali-nvtf-plugin 0.26.0+nv20.10 nvidia-nccl2.7.8 nvidia-pyindex1.0.5 nvidia-tensorboard1.15.0+nv20.10 nvidia-tensorrt7.2.1.4 tensorflow-estimator1.15.1

且依赖包的版本也需要严格对应(以上版本都是对应TensorFlow1.15.4+nv20.10的),否则会报错无法安装。最后安装nvidia-tensorflow,可以得到版本是1.15.4+nv20.10。安装结果如下图。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

考虑到大家都不容易下载,我已经把依赖包下载下来并传到网盘了,大家可以自行下载。依赖包下载地址(提取密码5tgm)。有一些包有安装的先后顺序,大家在尝试之后就知道了,就不详细叙述了(也忘记了0.0)。
4. TensorFlow测试
最后安装完了TensorFlow,尝试一下是否可用。
深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

深度学习|RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置
文章图片

可以看到TensorFlow已经安装成功,且可以识别到显卡并调用cudnn了。
四、后记 后面尝试训练并推理使用,发现显卡已经是可用的状态了,且性能真的可以比得上rtx2080ti,在训练crnn时发现训练速度甚至能提升20%,推理时与2080ti速度差不多,但价格便宜近一半,确实是性价比很高的卡。
参考 【1】: NVIDIA CUDA Toolkit Release Notes
【2】: RTX3080/RTX3090驱动安装CUDA11.1+CUDNN8.0.4.30+pytorch源码编译
【3】: 手起刀落 RTX 3080 - ResNet50 Benchmark Test
【4】: cuDNN Release 8.x.x
【5】: Accelerating TensorFlow on NVIDIA A100 GPUs

    推荐阅读