其實安裝部署的辦法有很多種,這里記錄的是經(jīng)過我本人親自驗證通過的一種辦法。
1、首先安裝一個干凈的 Ubuntu 20.04.2.0,注意在安裝時不要選擇“為圖形或者無線硬件,以及其它媒體格式安裝第三方軟件”,否則安裝完畢后,可能會進不去系統(tǒng)。
2、安裝Anaconda,https://www.anaconda.com/products/individual#Downloads,之所以先裝anaconda主要是是為了順帶安裝gcc。
3、CUDA11.1.1,按照官網(wǎng)提示安裝即可。注意,官網(wǎng)提供的cuda自帶顯卡驅(qū)動455.32.00,所以不需要先安裝顯卡驅(qū)動,只要嚴(yán)格按照官網(wǎng)的提示把CUDA裝上,顯卡驅(qū)動自然就會裝好。注意,我在安裝CUDA11.1以前的老版本時,一直是安裝失敗。
https://developer.nvidia.com/cuda-11.1.1-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=2004&target_type=deblocal
裝好之后,還需要改一下環(huán)境變量:
sudo vim .bashrc
加入下面環(huán)境變量后保存退出。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
export PATH=$PATH:/usr/local/cuda-11.1/bin
export CUDA_HOME=/usr/local/cuda-11.1
source ~/.bashrc

4、安裝cudnn,地址:https://developer.nvidia.com/rdp/cudnn-download,必須注冊登錄才可下載,我選的是
Download cuDNN v8.0.5 (November 9th, 2020), for CUDA 11.1里的 cuDNN Runtime Library for Ubuntu20.04 x86_64 (Deb),其他的版本沒試過
下載后,直接sudo dpkg -i libcudnn8_8.0.5.39-1+cuda11.1_amd64.deb即可。
重啟電腦后,檢查顯卡驅(qū)動是否正常工作,可以用nvidia-smi命令
5、安裝tensorflow,這里用的清華鏡像。
pip install tensorflow-gpu --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple some-package
6、輸入 python,進入python環(huán)境,然后輸入
import tensorflow as tf
tf.config.list_physical_devices(‘GPU’)
此時可能會提示缺少 libcusolver.so.10(我在安裝的時候有一次沒有遇到這個錯誤,原因不明),解決辦法是把?libcusolver.so.11 復(fù)制并改名為 libcusolver.so.10,簡單粗暴,貌似也確實管用。參考命令如下:
cd /usr/local/cuda-11.1/lib64
sudo cp libcusolver.so.11 libcusolver.so.10
此時再去測試tf2.4,顯卡就可以正常加載了。