??近一段時間,由于工作繁忙,一直沒有時間來好好總結(jié)、梳理自己的知識體系。最近一段時間趁著比較得空,會陸續(xù)將對近一年來的筆記進行梳理,記錄。一來鞏固所學,進一步消化吸收;二來,供各位讀者參考,共同學習進步。
- 安裝Anaconda
??在Anaconda installer archive選擇合適的Anaconda版本右鍵復制下載鏈接,然后在Ubuntu命令行使用wget下載:
$ wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh
下載完成后運行腳本安裝:
$ bash Anaconda3-2019.10-Linux-x86_64.sh
下載vim編輯器:
$ sudo apt install vim
在命令行運行:
$ conda --version
如果報錯,說明conda沒有被加入環(huán)境變量,需要配置.bashrc文件:
$ vim .bashrc
在文件的最后一行設(shè)置當前的Anaconda安裝路徑為環(huán)境變量,以我的路徑為例:/home/***/anaconda3/:
$ export PATH="/home/***/anaconda3/bin:$PATH"
再運行:
$ source .bashrc
執(zhí)行修改好的.bashrc文件
$ conda --veriosn
$ conda 4.7.12
此時會輸出你當前的conda版本
- 安裝顯卡驅(qū)動
運行ubuntu-drivers devices查看GPU型號和系統(tǒng)推薦驅(qū)動

可以使用
$ sudo ubuntu-drivers autoinstall
命令安裝系統(tǒng)推薦版本(nvidia-driver-440 - distro non-free recommended),當然也可以安裝指定版本的驅(qū)動:
$ sudo apt install nvidia-435
如果安裝錯誤可以卸載顯卡驅(qū)動
$ sudo apt-get --purge remove "*nvidia*"
$ sudo apt autoremove
卸載CUDA Toolkit
$ sudo apt-get --purge remove "*cublas*" "cuda*"
3.安裝tensorflow
??目前的Anaconda已經(jīng)支持安裝Tensorflow2.x版本,并且默認安裝GPU版本。使用conda安裝,會自動安裝對應(yīng)版本的CUDA和cuDNN,一勞永逸。
$ conda install tensorflow==2.1
不準備用conda安裝的讀者,可以參考經(jīng)過Tensorflow官方測試的構(gòu)建配置:

安裝指定版本的cudnn
$ conda install cudnn=7.4.0
- 安裝常用軟件
安裝Git
$ sudo apt install git
安裝Opencv
$ sudo apt install opencv-python
安裝神經(jīng)網(wǎng)絡(luò)可視化所需要的包
$ pip install pydot
$ sudo apt install graphviz
在模型訓練時,最常遇見的就是OOM,倍感頭疼,最后附一個張量顯存計算的說明:
1 G = 1000 MB
1 M = 1000 KB
1 K = 1000 Byte
-
1 B = 8 bit
一般一個8-bit的整型變量所占的空間(8/8)為
1B也就是8bit。而32位的float則占(32/8)4B也就是32bit。而雙精度浮點型double和長整型long在平常的訓練中一般不會使用。
如一個shape位[64,600,1067]的float張量,總共呦64*600*1067個float型的數(shù)字,每個float為32bit即4B,則該張量在GPU中占用的顯存大小為,將近164M。
關(guān)于顯存計算的跟詳細內(nèi)容可以參考:
淺談深度學習:如何計算模型以及中間變量的顯存占用大小