[Python][MachineLearning]Ubuntu_Linux下機(jī)器學(xué)習(xí)環(huán)境的搭建:cuda-11.3+cudnn-8.2+pytorch+tensorflow-gpu...

使用Miniconda配置機(jī)器學(xué)習(xí)環(huán)境

隨著研究的進(jìn)一步推進(jìn),即將開展對ML方法應(yīng)用的工作,首先就需要搭建能work的工作環(huán)境。在踩坑后,發(fā)現(xiàn)cuda,cudnn和pytorch之間的版本對應(yīng)關(guān)系非常重要。在這里記錄一下自己搭建環(huán)境的摸索過程,這樣以后需要搭建新的環(huán)境時(shí)就不會手忙腳亂啦!

1. 創(chuàng)建虛擬環(huán)境

為了防止出現(xiàn)環(huán)境的沖突,我們新建一個(gè)虛擬環(huán)境。

conda create -n tf python=3.8
conda activate tf

創(chuàng)建一個(gè)python版本為3.8的環(huán)境命名為tf,并激活此環(huán)境。
在這里也記錄一下刪除環(huán)境的指令。

conda remove -n $env_name --all

2. 查看本機(jī)的GPU型號和CUDA版本

nvidia-smi

輸出為


GPU型號和cuda版本

這里我使用的機(jī)器上的GPU是英偉達(dá),CUDA版本為11.6。這個(gè)版本目前來說是最新的,但是對應(yīng)的cudnn版本和pytorch很難找到,所以后面我選擇使用11.3的版本重新安裝。

3. 安裝CUDA和CUDNN

查找對應(yīng)的CUDA,CUDNN版本,鏈接:https://www.tensorflow.org/install/source#linux
我選擇了CUDA11.3+cudnn8.2+tensorflow-gpu2.7的組合。

  1. 首先,安裝CUDA。
    其他攻略里有提到需要先卸載原先的CUDA再安裝,但我這里沒有管理員權(quán)限,所以只能利用conda在我的虛擬環(huán)境中安裝新的CUDA。
    因?yàn)橐惨惭bpytorch,現(xiàn)在的版本在安裝pytorch時(shí)系統(tǒng)會給你選擇合適的cuda版本,所以cuda的安裝是在pytorch的安裝時(shí)順帶的。官網(wǎng)鏈接:https://pytorch.org/
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch
  1. 第二,安裝cudnn。
    上一步完成時(shí),對應(yīng)cudnn是沒有安裝的。如果cudnn沒有安裝正確,在運(yùn)行模型時(shí)會報(bào)錯(cuò)(踩過的坑之一)。
conda install cudnn=8.2

4. 安裝Tensorflow

這一步?jīng)]有太多波瀾,直接安裝

conda install tensorflow-gpu=2.7

這里,查過的很多攻略用的是pip來安裝,但考慮到pip安裝最終是全局安裝,造成包管理混亂的問題,所以我還是選擇了conda來安裝。

5. Quick check

import tensorflow as tf
tf.test.is_gpu_available()

import torch
torch.cuda.is_available()

以上。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容