1、檢查tensorflow、cuda、cudnn的版本一致性
windows
linux
pytorch 可以忽略,只需要保證cuda和cudnn匹配即可。
2、下載適配版本cuda和cudnn,cuda包含顯卡驅(qū)動(dòng)
cuda
cudnn
下載cuda和cudnn相應(yīng)的版本到服務(wù)器上,cuda建議下載run(local)文件,cudnn建議下載tar文件,不建議deb文件
此文章配置的服務(wù)器為ubuntu server 18.04.2,配置的tensorflow為r1.13,cuda版本10.0,cudnn支持的最新版本7.4.2
3、安裝編譯工具
sudo apt-get install gcc g++ make
4、安裝cuda
cd /path/to/your-cuda-file
sudo chmod +x cuda-file.run
sudo ./cuda-file.run
#1 accpet
#2 nvidia driver、cuda和soft link 安裝選yes,其他根據(jù)需要
#cuda default located in /usr/local/cuda-10.0, and soft link is /usr/local/cuda/
#3 卸載驅(qū)動(dòng)使用nvidia-uninstall
5、安裝cudnn
復(fù)制文件
#使用tar文件安裝
cd /path/to/your-cudnn-file
sudo tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
#把cudnn對(duì)應(yīng)的dll/so文件放在cuda的目錄下,就算cuann配置好
#或者使用deb安裝
sudo dpkg -i libcudnn7_7.0.3.11-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-devel_7.0.3.11-1+cuda9.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.0.3.11-1+cuda9.0_amd64.deb
設(shè)置環(huán)境變量
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
# 64bit
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# 32bit
export LD_LIBRARY_PATH=/usr/local/cuda/lib${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
# 加入~/.bashrc最后兩行
sudo vim ~/.bashrc
# 重新激活環(huán)境
source ~/.bashrc
# 更好的辦法,更新鏈接庫(kù)
sudo rm /usr/local/cuda/lib64/libcudnn.so.7
sudo ln -s /usr/local/cuda/lib64/libcudnn.so /usr/local/cuda/lib64/libcudnn.so.7
sudo ldconfig /usr/local/cuda/lib64
6、安裝pytorch/tensorflow-gpu并進(jìn)行測(cè)試
cuda/
#python3
import torch
torch.cuda.is_available()
orch.cuda.device_count()
#or
import tensorflow as tf
tf.test.is_built_with_cuda()
tf.test.is_gpu_available(cuda_only=False, min_cuda_compute_capability=None)