本文首發(fā)于簡(jiǎn)書,西北小生_的博客:http://www.itdecent.cn/p/5e90f2deb9c4,轉(zhuǎn)載請(qǐng)私信詢問(wèn)!
1.Ubuntu系統(tǒng)安裝
參考我的這篇博客
2.Ubuntu源更新和指令集安裝
1.執(zhí)行命令:
sudo apt-get upgrade
sudo apt-get update
進(jìn)行Ubuntu源和系統(tǒng)更新。
2.執(zhí)行命令:
sudo apt-get install build-essential cmake g++ gfortran git
sudo apt-get install pkg-config python-dev software-properties-common wget
進(jìn)行基本指令集、編譯器和軟件庫(kù)等的安裝。
3.執(zhí)行命令:
sudo apt-get autoremove
刪除為了滿足其它軟件包的依賴而安裝的,但現(xiàn)在不再需要的軟件包。
sudo rm -rf /var/lib/apt/lists/*
刪除更新、緩存文件列表。
3.英偉達(dá)顯卡驅(qū)動(dòng)安裝
1.打開終端,執(zhí)行命令:
sudo apt-get purge nvidia-*
刪除可能存在的已有驅(qū)動(dòng)。
2.執(zhí)行命令:
sudo add-apt-repository ppa:graphics-drivers/ppa
添加顯卡驅(qū)動(dòng)下載地址到ppa。
3.執(zhí)行命令:
sudo apt-get update
4.執(zhí)行命令:
ubuntu-drivers devices
查看顯卡設(shè)備和顯卡驅(qū)動(dòng)。返回的文檔中可以看到多個(gè)可用的顯卡驅(qū)動(dòng),其中有一個(gè)系統(tǒng)推薦的型號(hào),我的是“driver : nvidia-driver-450 - third-party free recommended”。
5.執(zhí)行命令:
sudo apt-get install nvidia-driver-450
安裝英偉達(dá)顯卡驅(qū)動(dòng)?!咀⒁猓簄vidia-driver-450是英偉達(dá)顯卡驅(qū)動(dòng)的版本,根據(jù)實(shí)際版本進(jìn)行修改!】
6.執(zhí)行命令:
reboot
重啟電腦。
7.重啟完成后,打開終端,執(zhí)行命令:
nvidia-smi
即可查看當(dāng)前GPU使用情況。
4.CUDA安裝
1.進(jìn)入Pytorch官網(wǎng)查看你要安裝的Pytorch版本需要的CUDA版本,該頁(yè)面一般只顯示最新版本,點(diǎn)擊右下角的Previous versions of PyTorch查看Pytorch歷史版本及其需要的CUDA版本。
2.進(jìn)入https://developer.nvidia.com/cuda-downloads,在下方點(diǎn)擊“Legacy Releases”,進(jìn)入CUDA歷史發(fā)行版本頁(yè)面。
3.進(jìn)入https://developer.nvidia.com/cuda-toolkit-archive,選擇相應(yīng)的CUDA版本,我這里選擇CUDA 10.2,即CUDA Toolkit 10.2 (Nov 2019)選項(xiàng),點(diǎn)擊該超鏈接進(jìn)入下載。
3.進(jìn)入https://developer.nvidia.com/cuda-10.2-download-archive,依次選擇“Linux——>x86_64——>Ubuntu——>18.04——>runfile(local)”,會(huì)在下方出現(xiàn)相應(yīng)的安裝命令。
4.執(zhí)行命令:
wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
下載CUDA 10.2安裝包,下載結(jié)束后執(zhí)行命令:
sudo sh cuda_10.2.89_440.33.01_linux.run
安裝CUDA 10.2。在輸入accept按回車后會(huì)出現(xiàn)一個(gè)安裝列表界面,其中第一項(xiàng)就是英偉達(dá)顯卡驅(qū)動(dòng),滾動(dòng)鼠標(biāo)或按鍵盤上下鍵,選中英偉達(dá)驅(qū)動(dòng)“nvidia driver”選項(xiàng),按回車后確認(rèn)這一項(xiàng)最前面的“[ x ]”變成“[ ]”,即取消安裝英偉達(dá)驅(qū)動(dòng),再選中最下面的“Install”選項(xiàng)后按回車進(jìn)行CUDA安裝。之后一切選項(xiàng)都選擇yes或回車,直到安裝結(jié)束。
5.安裝完成后,配置CUDA的環(huán)境變量,執(zhí)行命令:
sudo gedit /etc/profile
打開profile文件的文本編輯界面,添加如下語(yǔ)句至文件末尾:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
保存并退出文本編輯界面。【注意:修改 /etc/profile會(huì)使添加的路徑對(duì)計(jì)算機(jī)所有用戶生效;修改 ~/.bashrc僅使添加的路徑對(duì)當(dāng)前用戶生效!以上兩句添加的內(nèi)容千萬(wàn)不能出錯(cuò),否則會(huì)開不了機(jī)!別問(wèn)我怎么知道的…】
6.返回終端,執(zhí)行命令:
source /etc/profile
生效環(huán)境變量,然后重啟計(jì)算機(jī)。
7.重啟后登錄,進(jìn)入用戶桌面,打開終端,執(zhí)行命令:
nvcc -V
即可查看CUDA版本信息。
5.CUDA測(cè)試(可選,上步執(zhí)行均無(wú)報(bào)錯(cuò)后可直接跳過(guò)這一步)
1.打開終端,執(zhí)行命令:
/usr/local/cuda/bin/cuda-install-samples-10.2.sh ~/cuda-samples
注意:10.2是CUDA版本號(hào),根據(jù)實(shí)際安裝CUDA版本進(jìn)行修改。
2.執(zhí)行命令:
cd ~/cuda-samples/NVIDIA*Samples
進(jìn)入指定目錄。
3.執(zhí)行命令:
make -j $(($(nproc) + 1))
進(jìn)行編譯。
4.執(zhí)行命令:
bin/x86_64/linux/release/deviceQuery
進(jìn)行CUDA樣例測(cè)試,若返回“Result = PASS”則表明安裝正常。
6.cuDNN安裝
1.進(jìn)入https://developer.nvidia.com/cudnn,點(diǎn)擊下面的“Download cuDNN”按鈕,進(jìn)入Nvidia用戶登錄界面。
2.點(diǎn)擊“Login”按鈕,進(jìn)行用戶登錄。新用戶需先點(diǎn)擊“Join Now”按鈕進(jìn)行注冊(cè),注冊(cè)完成后再登錄才能下載cuDNN。
3.在登錄后跳轉(zhuǎn)的頁(yè)面中,勾選“I Agree To the Terms of the cuDNN Software License Agreement”前面的方框,在下方顯示的下載列表中點(diǎn)擊對(duì)應(yīng)[Download cuDNN v8.0.2 (July 24th, 2020), for CUDA 10.2]的鏈接,在子列表中點(diǎn)擊[cuDNN Library for Linux (x86)],下載cuDNN安裝包?!咀⒁猓哼@里的cuDNN一定要和CUDA版本對(duì)應(yīng)!】
4.下載完成后,打開終端,進(jìn)入cuDNN下載文件所在目錄(默認(rèn)為 /home/Downloads文件夾下),執(zhí)行命令:
tar -xzvf cudnn-10.2-linux-x64-v8.0.2.39.tgz
進(jìn)行解壓,獲得5個(gè)涉及“cudnn”的文件。【注意:cudnn-10.2-linux-x64-v8.0.2.39.tgz為下載文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】
5.解壓完成后,執(zhí)行命令:
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
將對(duì)應(yīng)文件復(fù)制到系統(tǒng)根目錄(usr/local)下。
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
賦予對(duì)應(yīng)文件相應(yīng)的訪問(wèn)、管理權(quán)限。
6.重啟計(jì)算機(jī),完成cuDNN的安裝和配置。
7.ssh安裝和啟動(dòng)
1.打開終端,執(zhí)行命令:
sudo apt-get install ssh
進(jìn)行ssh的安裝。
2.執(zhí)行命令:
ssh -V
查看ssh版本信息。
3.執(zhí)行命令:
ps -e|grep ssh
查看ssh是否開啟。若有返回“sshd”等信息,則ssh開啟成功。
8.Anaconda安裝
1.進(jìn)入https://www.anaconda.com/products/individual,點(diǎn)擊下方的“Download”按鈕,進(jìn)入下載頁(yè)面。
2.點(diǎn)擊頁(yè)面右邊的Linux 下方的64-Bit (x86) Installer (550 MB)鏈接,下載Anaconda安裝包。
3.下載完成后,打開終端,進(jìn)入安裝包所在目錄下(默認(rèn)為/home/Downloads目錄下),執(zhí)行命令:
bash Anaconda3-2020.07-Linux-x86_64.sh
開始安裝Anaconda?!咀⒁猓篈naconda3-2020.07-Linux-x86_64.sh為安裝包的文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】
4.安裝過(guò)程中所有詢問(wèn)都選擇accept/yes/回車。
5.安裝完成后,執(zhí)行命令:
source ~/.bashrc
(僅在當(dāng)前用戶下)生效環(huán)境變量,關(guān)閉當(dāng)前終端,完成Anaconda的安裝和配置。
6.打開新終端,輸入命令:
python
進(jìn)入python命令行界面,并返回類似“[GCC 7.3.0] :: Anaconda, Inc. on linux”的信息,則表明Anaconda安裝和配置成功。
9.PyTorch安裝
1.進(jìn)入PyTorch官網(wǎng),選擇一款已安裝的CUDA版本支持的PyTorch版本,執(zhí)行命令:
conda install pytorch torchvision cudatoolkit=10.2 -c pytorch
安裝PyTorch和tensorboard。對(duì)安裝過(guò)程中的詢問(wèn)輸出y回車即可?!咀⒁猓篶udatoolkit選擇相應(yīng)的版本!】
2.如果在安裝過(guò)程中出現(xiàn)下載pytorch太慢導(dǎo)致下載失敗的話,可以嘗試用pip命令安裝。
3.如果還是失敗的話,就需要更換國(guó)內(nèi)的conda源,我們這里將conda源更換位清華源。
執(zhí)行命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --set show_channel_urls yes
更換位清華源。執(zhí)行新的命令下載并安裝pytorch,這里將第1步命令中的“-c”去掉:
conda install pytorch torchvision cudatoolkit=10.2 pytorch
到這里,PyTorch版本的深度學(xué)習(xí)服務(wù)器就安裝完畢了。
10.安裝VSCODE編輯器
vscode是微軟推出的一款輕量文本編輯器,可以運(yùn)行Python,C++,Java等編程語(yǔ)言,非常好用。舊版本的Anaconda自帶vscode,新版本的需要自己?jiǎn)为?dú)安裝。
1.進(jìn)入https://code.visualstudio.com/download,點(diǎn)擊中間企鵝下面左邊的“.deb”下載按鈕,會(huì)自動(dòng)下載64位版本的安裝包。
2.下載完成后,打開終端,進(jìn)入安裝包所在目錄(默認(rèn)為/home/Downloads)下,執(zhí)行命令:
sudo dpkg -i code_1.48.0-1597304990_amd64.deb
sudo apt-get install -f
安裝vscode。【注意:code_1.48.0-1597304990_amd64.deb為安裝包的文件名,根據(jù)實(shí)際下載文件進(jìn)行修改!】
3.安裝完成后,執(zhí)行命令:
code .
打開vscode界面。
4.點(diǎn)擊左側(cè)豎排第五個(gè)插件(Extensions)選項(xiàng),在出現(xiàn)的小窗口上方的搜索框中輸出python,一般下方第一個(gè)選項(xiàng)就是python解釋器,點(diǎn)擊右下角的Install按鈕,安裝python解釋器。

待安裝完成后,就可以運(yùn)行python程序了。
11.新建用戶
1.執(zhí)行命令:
sudo useradd -r -m -s /bin/bash new_user
創(chuàng)建新用戶,用戶名為new_user,可根據(jù)自己的用戶名進(jìn)行修改。
2.執(zhí)行命令:
sudo passwd new_user
設(shè)置新用戶的密碼,按回車后即可看到密碼輸入提示。
設(shè)置成功后,執(zhí)行命令:
cd /home/
切換至home目錄下,執(zhí)行命令:
ls
查看home目錄下的子目錄,若存在創(chuàng)建的新用戶new_user命名的文件夾,說(shuō)明創(chuàng)建新用戶成功。