Ubuntu深度學(xué)習(xí)服務(wù)器安裝及環(huán)境搭建(Pytorch版)

本文首發(fā)于簡(jiǎn)書,西北小生_的博客:http://www.itdecent.cn/p/5e90f2deb9c4,轉(zhuǎn)載請(qǐng)私信詢問(wèn)!

1.Ubuntu系統(tǒng)安裝

參考我的這篇博客

2.Ubuntu源更新和指令集安裝

1.執(zhí)行命令:

sudo apt-get upgrade
sudo apt-get update

進(jìn)行Ubuntu源和系統(tǒng)更新。

2.執(zhí)行命令:

sudo apt-get install build-essential cmake g++ gfortran git
sudo apt-get install pkg-config python-dev software-properties-common wget

進(jìn)行基本指令集、編譯器和軟件庫(kù)等的安裝。

3.執(zhí)行命令:

sudo apt-get autoremove

刪除為了滿足其它軟件包的依賴而安裝的,但現(xiàn)在不再需要的軟件包。

sudo rm -rf /var/lib/apt/lists/*

刪除更新、緩存文件列表。

3.英偉達(dá)顯卡驅(qū)動(dòng)安裝

1.打開終端,執(zhí)行命令:

sudo apt-get purge nvidia-*

刪除可能存在的已有驅(qū)動(dòng)。

2.執(zhí)行命令:

sudo add-apt-repository ppa:graphics-drivers/ppa

添加顯卡驅(qū)動(dòng)下載地址到ppa。

3.執(zhí)行命令:

sudo apt-get update

4.執(zhí)行命令:

ubuntu-drivers devices

查看顯卡設(shè)備和顯卡驅(qū)動(dòng)。返回的文檔中可以看到多個(gè)可用的顯卡驅(qū)動(dòng),其中有一個(gè)系統(tǒng)推薦的型號(hào),我的是“driver : nvidia-driver-450 - third-party free recommended”。

5.執(zhí)行命令:

sudo apt-get install nvidia-driver-450

安裝英偉達(dá)顯卡驅(qū)動(dòng)?!咀⒁猓簄vidia-driver-450是英偉達(dá)顯卡驅(qū)動(dòng)的版本,根據(jù)實(shí)際版本進(jìn)行修改!】

6.執(zhí)行命令:

reboot

重啟電腦。

7.重啟完成后,打開終端,執(zhí)行命令:

nvidia-smi

即可查看當(dāng)前GPU使用情況。

4.CUDA安裝

1.進(jìn)入Pytorch官網(wǎng)查看你要安裝的Pytorch版本需要的CUDA版本,該頁(yè)面一般只顯示最新版本,點(diǎn)擊右下角的Previous versions of PyTorch查看Pytorch歷史版本及其需要的CUDA版本。

2.進(jìn)入https://developer.nvidia.com/cuda-downloads,在下方點(diǎn)擊“Legacy Releases”,進(jìn)入CUDA歷史發(fā)行版本頁(yè)面。

3.進(jìn)入https://developer.nvidia.com/cuda-toolkit-archive,選擇相應(yīng)的CUDA版本,我這里選擇CUDA 10.2,即CUDA Toolkit 10.2 (Nov 2019)選項(xiàng),點(diǎn)擊該超鏈接進(jìn)入下載。

3.進(jìn)入https://developer.nvidia.com/cuda-10.2-download-archive,依次選擇“Linux——>x86_64——>Ubuntu——>18.04——>runfile(local)”,會(huì)在下方出現(xiàn)相應(yīng)的安裝命令。

4.執(zhí)行命令:

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run

下載CUDA 10.2安裝包,下載結(jié)束后執(zhí)行命令:

sudo sh cuda_10.2.89_440.33.01_linux.run

安裝CUDA 10.2。在輸入accept按回車后會(huì)出現(xiàn)一個(gè)安裝列表界面,其中第一項(xiàng)就是英偉達(dá)顯卡驅(qū)動(dòng),滾動(dòng)鼠標(biāo)或按鍵盤上下鍵,選中英偉達(dá)驅(qū)動(dòng)“nvidia driver”選項(xiàng),按回車后確認(rèn)這一項(xiàng)最前面的“[ x ]”變成“[ ]”,即取消安裝英偉達(dá)驅(qū)動(dòng),再選中最下面的“Install”選項(xiàng)后按回車進(jìn)行CUDA安裝。之后一切選項(xiàng)都選擇yes或回車,直到安裝結(jié)束。

5.安裝完成后,配置CUDA的環(huán)境變量,執(zhí)行命令:

sudo gedit /etc/profile

打開profile文件的文本編輯界面,添加如下語(yǔ)句至文件末尾:

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

保存并退出文本編輯界面。【注意:修改 /etc/profile會(huì)使添加的路徑對(duì)計(jì)算機(jī)所有用戶生效;修改 ~/.bashrc僅使添加的路徑對(duì)當(dāng)前用戶生效!以上兩句添加的內(nèi)容千萬(wàn)不能出錯(cuò),否則會(huì)開不了機(jī)!別問(wèn)我怎么知道的…】

6.返回終端,執(zhí)行命令:

source /etc/profile

生效環(huán)境變量,然后重啟計(jì)算機(jī)。

7.重啟后登錄,進(jìn)入用戶桌面,打開終端,執(zhí)行命令:

nvcc -V

即可查看CUDA版本信息。

5.CUDA測(cè)試(可選,上步執(zhí)行均無(wú)報(bào)錯(cuò)后可直接跳過(guò)這一步)

1.打開終端,執(zhí)行命令:

/usr/local/cuda/bin/cuda-install-samples-10.2.sh ~/cuda-samples

注意:10.2是CUDA版本號(hào),根據(jù)實(shí)際安裝CUDA版本進(jìn)行修改。

2.執(zhí)行命令:

cd ~/cuda-samples/NVIDIA*Samples

進(jìn)入指定目錄。

3.執(zhí)行命令:

make -j $(($(nproc) + 1))

進(jìn)行編譯。

4.執(zhí)行命令:

bin/x86_64/linux/release/deviceQuery

進(jìn)行CUDA樣例測(cè)試,若返回“Result = PASS”則表明安裝正常。

6.cuDNN安裝

1.進(jìn)入https://developer.nvidia.com/cudnn,點(diǎn)擊下面的“Download cuDNN”按鈕,進(jìn)入Nvidia用戶登錄界面。

2.點(diǎn)擊“Login”按鈕,進(jìn)行用戶登錄。新用戶需先點(diǎn)擊“Join Now”按鈕進(jìn)行注冊(cè),注冊(cè)完成后再登錄才能下載cuDNN。

3.在登錄后跳轉(zhuǎn)的頁(yè)面中,勾選“I Agree To the Terms of the cuDNN Software License Agreement”前面的方框,在下方顯示的下載列表中點(diǎn)擊對(duì)應(yīng)[Download cuDNN v8.0.2 (July 24th, 2020), for CUDA 10.2]的鏈接,在子列表中點(diǎn)擊[cuDNN Library for Linux (x86)],下載cuDNN安裝包?!咀⒁猓哼@里的cuDNN一定要和CUDA版本對(duì)應(yīng)!】

4.下載完成后,打開終端,進(jìn)入cuDNN下載文件所在目錄(默認(rèn)為 /home/Downloads文件夾下),執(zhí)行命令:

tar -xzvf cudnn-10.2-linux-x64-v8.0.2.39.tgz

進(jìn)行解壓,獲得5個(gè)涉及“cudnn”的文件。【注意:cudnn-10.2-linux-x64-v8.0.2.39.tgz為下載文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】

5.解壓完成后,執(zhí)行命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

將對(duì)應(yīng)文件復(fù)制到系統(tǒng)根目錄(usr/local)下。

sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

賦予對(duì)應(yīng)文件相應(yīng)的訪問(wèn)、管理權(quán)限。

6.重啟計(jì)算機(jī),完成cuDNN的安裝和配置。

7.ssh安裝和啟動(dòng)

1.打開終端,執(zhí)行命令:

sudo apt-get install ssh

進(jìn)行ssh的安裝。

2.執(zhí)行命令:

ssh -V

查看ssh版本信息。

3.執(zhí)行命令:

ps -e|grep ssh

查看ssh是否開啟。若有返回“sshd”等信息,則ssh開啟成功。

8.Anaconda安裝

1.進(jìn)入https://www.anaconda.com/products/individual,點(diǎn)擊下方的“Download”按鈕,進(jìn)入下載頁(yè)面。

2.點(diǎn)擊頁(yè)面右邊的Linux 下方的64-Bit (x86) Installer (550 MB)鏈接,下載Anaconda安裝包。

3.下載完成后,打開終端,進(jìn)入安裝包所在目錄下(默認(rèn)為/home/Downloads目錄下),執(zhí)行命令:

bash Anaconda3-2020.07-Linux-x86_64.sh

開始安裝Anaconda?!咀⒁猓篈naconda3-2020.07-Linux-x86_64.sh為安裝包的文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】

4.安裝過(guò)程中所有詢問(wèn)都選擇accept/yes/回車。

5.安裝完成后,執(zhí)行命令:

source ~/.bashrc

(僅在當(dāng)前用戶下)生效環(huán)境變量,關(guān)閉當(dāng)前終端,完成Anaconda的安裝和配置。

6.打開新終端,輸入命令:

python

進(jìn)入python命令行界面,并返回類似“[GCC 7.3.0] :: Anaconda, Inc. on linux”的信息,則表明Anaconda安裝和配置成功。

9.PyTorch安裝

1.進(jìn)入PyTorch官網(wǎng),選擇一款已安裝的CUDA版本支持的PyTorch版本,執(zhí)行命令:

conda install pytorch torchvision cudatoolkit=10.2 -c pytorch

安裝PyTorch和tensorboard。對(duì)安裝過(guò)程中的詢問(wèn)輸出y回車即可?!咀⒁猓篶udatoolkit選擇相應(yīng)的版本!】

2.如果在安裝過(guò)程中出現(xiàn)下載pytorch太慢導(dǎo)致下載失敗的話,可以嘗試用pip命令安裝。

3.如果還是失敗的話,就需要更換國(guó)內(nèi)的conda源,我們這里將conda源更換位清華源。
執(zhí)行命令:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes

更換位清華源。執(zhí)行新的命令下載并安裝pytorch,這里將第1步命令中的“-c”去掉:

conda install pytorch torchvision cudatoolkit=10.2 pytorch

到這里,PyTorch版本的深度學(xué)習(xí)服務(wù)器就安裝完畢了。

10.安裝VSCODE編輯器

vscode是微軟推出的一款輕量文本編輯器,可以運(yùn)行Python,C++,Java等編程語(yǔ)言,非常好用。舊版本的Anaconda自帶vscode,新版本的需要自己?jiǎn)为?dú)安裝。

1.進(jìn)入https://code.visualstudio.com/download,點(diǎn)擊中間企鵝下面左邊的“.deb”下載按鈕,會(huì)自動(dòng)下載64位版本的安裝包。

2.下載完成后,打開終端,進(jìn)入安裝包所在目錄(默認(rèn)為/home/Downloads)下,執(zhí)行命令:

sudo dpkg -i code_1.48.0-1597304990_amd64.deb
sudo apt-get install -f

安裝vscode。【注意:code_1.48.0-1597304990_amd64.deb為安裝包的文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】

3.安裝完成后,執(zhí)行命令:

code .

打開vscode界面。

4.點(diǎn)擊左側(cè)豎排第五個(gè)插件(Extensions)選項(xiàng),在出現(xiàn)的小窗口上方的搜索框中輸出python,一般下方第一個(gè)選項(xiàng)就是python解釋器,點(diǎn)擊右下角的Install按鈕,安裝python解釋器。


python解釋器

待安裝完成后,就可以運(yùn)行python程序了。

11.新建用戶

1.執(zhí)行命令:

sudo useradd -r -m -s /bin/bash new_user

創(chuàng)建新用戶,用戶名為new_user,可根據(jù)自己的用戶名進(jìn)行修改。

2.執(zhí)行命令:

sudo passwd new_user

設(shè)置新用戶的密碼,按回車后即可看到密碼輸入提示。

設(shè)置成功后,執(zhí)行命令:

cd /home/

切換至home目錄下,執(zhí)行命令:

ls

查看home目錄下的子目錄,若存在創(chuàng)建的新用戶new_user命名的文件夾,說(shuō)明創(chuàng)建新用戶成功。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容