linux安裝多個版本的cuda和cudnn,無sudo權限安裝,pip install tensorflowgpu==1.5

無sudo權限,參考https://blog.csdn.net/weixin_41278720/article/details/81255265
CUDA Toolkit 9.0和cudnn 7

CUDA Toolkit 9.0.png

參考http://www.itdecent.cn/p/9c98d51e4de3
1.下載好文件,進入文件路徑
2.運行安裝命令

sudo sh cuda_9.0.176_384.81_linux.run

3.安裝過程中的一些選擇

Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 396.37?
(y)es/(n)o/(q)uit: n

Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y

Enter Toolkit Location
 [ default is /usr/local/cuda-9.0 ]: 

Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y

Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y

4.在/usr/local可以看到cuda cuda-8.0 cuda-9.0 cuda-9.2
5.在~/.bashrc中添加/修改環(huán)境變量:

export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64  
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64  

在終端運行source ~/.bashrc使之生效

6.nvcc --version查看當前使用的cuda版本
將其切換到cuda-9.0

sudo rm -rf /usr/local/cuda  #刪除之前創(chuàng)建的軟鏈接
sudo ln -s /usr/local/cuda-9.0  /usr/local/cuda  #創(chuàng)建新的軟鏈接
nvcc --version

測試

編譯并測試設備 deviceQuery

cd /usr/local/cuda-9.2/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery 

編譯并測試帶寬 bandwidthTest

cd ../bandwidthTest
sudo make 
./bandwidthTest

如果這兩個測試結果都是Result = PASS,則說明安裝成功了

根據(jù)cuda-cudnn找對應版本

https://developer.nvidia.com/rdp/cudnn-archive

cudnn-archive.png

1.進入下載好的文件目錄,用命令解壓:

cp cudnn-9.0-linux-x64-v7.solitairetheme8 cudnn-9.0-linux-x64-v7.0.5.tgz
tar -xvzf cudnn-9.2-linux-x64-v7.4.2.24.tgz

在解壓后,得到的cuda目錄下執(zhí)行復制lib64和include文件夾到usr/local/cuda-9.0:

sudo cp include/cudnn.h /usr/local/cuda/include/
sudo cp lib64/lib* /usr/local/cuda/lib64/

之后執(zhí)行
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
查看cudnn版本為7.0.5:

#define CUDNN_MAJOR 7
#define CUDNN_MINOR 0
#define CUDNN_PATCHLEVEL 5
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

解決 ImportError: libcublas.so.9.0: cannot open shared object file: No such file

可能原因,CUDA版本不對

1、查看下版本信息
cat /usr/local/cuda/version.txt  

2、根據(jù)CUDA和tensorflow版本對應的關系表,檢查自己的版本是否匹配
3、如果不匹配

請安裝相應的TensorFlow或者CUDA版本

安裝對應版本TensorFlow的GPU版本
pip install tensorflow-gpu==版本號

安裝對應版本的CUDA Toolkit 9.0

4、如果匹配,仍然報錯
那是因為你的cuda環(huán)境變量配置有誤,請執(zhí)行:

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/【CUDA版本】/lib64

例如

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容