標(biāo)簽: 黑屏 ubuntu18.04 cuda10.1 gdm3 nvidia
前言
本文用于記錄作者在 ubuntu18.04 安裝 GPU(nvidia顯卡)深度學(xué)習(xí)環(huán)境 cuda10.1 的血汗史。
本文都是個(gè)人部署的經(jīng)驗(yàn),直接記錄成功的方法,中間很多坑就不加以描述了。
開(kāi)發(fā)環(huán)境一覽
- CPU:Intel? Core? i7-8700 CPU @ 3.20GHz
- GPU:Quadro P1000/PCIe/SSE2
- OS: UBUNTU 18.04.1LTS 64位
驅(qū)動(dòng)選型
PS:
安裝cuda的話,是無(wú)需安裝nvidia的驅(qū)動(dòng)的,cuda會(huì)自帶驅(qū)動(dòng)。
ubuntu18.04只支持cuda10以上的版本(2019/4/17)
禁用nouveau
1. 打開(kāi)blacklist.conf(這是一個(gè)開(kāi)源驅(qū)動(dòng)不支持深度學(xué)習(xí))
sudo vim /etc/modprobe.d/blacklist.conf
2. 在最后添加
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
3. 禁用nouveau內(nèi)核模塊
echo options nouveau modeset=0
sudo update-initramfs -u
4. 重啟
reboot
5. 如果運(yùn)行如下指令沒(méi)用打印出任何內(nèi)容, 恭喜你, 禁用nouveau成功了.
lsmod | grep nouveau
安裝驅(qū)動(dòng)
首先一個(gè)問(wèn)題:ubuntu18.04自帶的gdm3界面管理器是與nvidia的驅(qū)動(dòng)沖突的,直接安裝的后果是在登陸界面進(jìn)入用戶界面時(shí)會(huì)卡死。
解決方案:(沒(méi)有開(kāi)始卡住的同學(xué)請(qǐng)自行忽略)
如果已經(jīng)安裝了的朋友已經(jīng)卡死了沒(méi)關(guān)系,只要重啟,在登陸界面使用Ctrl+Alt+F1+F2就可以進(jìn)到tui命令行界面,再輸入賬戶密碼登陸后按Ctrl+Alt+F1
終極解決方案
更換gdm3為lightdm是的!就是16.04的用戶界面(有經(jīng)驗(yàn)的同學(xué)可以下載xdm自己挑)
sudo apt-get install lightdm (xdm)
sudo dpkg-reconfigure lightdm (不一定需要這個(gè),但是使用就會(huì)進(jìn)入界面)
接下來(lái)安裝就很簡(jiǎn)單了,只要按照提示全選就可以了。
如果提示查看失敗,查看log,大概是驅(qū)動(dòng)的問(wèn)題
1.禁用nouveau沒(méi)有成功
2.其他版本的驅(qū)動(dòng)有殘留,可嘗試
sudo apt-get remove --purge nvidia*
搞定就用經(jīng)典命令nvidia-smi試試吧
安裝cudnn7.5
cuda10.01只支持cudnn7.5,進(jìn)到頁(yè)面需要登陸一下才能下載
https://developer.nvidia.com/rdp/cudnn-download
下載四個(gè)包:
- cudnn-10.1-linux-x64-v7.5.0.56.tgz
- libcudnn7_7.5.0.56-1+cuda10.1_amd64.deb
- libcudnn7-dev_7.5.0.56-1+cuda10.1_amd64.deb
- libcudnn7-doc_7.5.0.56-1+cuda10.1_amd64.deb
然后解壓tgz包, 復(fù)制文件到cuda環(huán)境, 接著安裝deb包.
tar -zxvf cudnn-10.1-linux-x64-v7.5.0.56.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
sudo dpkg -i libcudnn7_7.5.0.56-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.5.0.56-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.5.0.56-1+cuda10.1_amd64.deb
這樣就完成安裝了, 用個(gè)小栗子來(lái)測(cè)試下吧
cp -r /usr/src/cudnn_samples_v7/ ~
cd ~/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
輸出 test passed! 就大功告成了
2019年4月29日更新 ?。?!千萬(wàn)不要升級(jí)內(nèi)核?。。?!
一旦更新內(nèi)核就完蛋了?。。?!
先是畫屏,重啟就黑屏無(wú)輸出
謹(jǐn)慎謹(jǐn)慎?。。。。?/p>
參考文章
《Ubuntu 18.04: gdm3 does not switch to graphics after update》
https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/1779476《Ubuntu18.04LTS下cuda10.0+cudnn7.5+TensorFlow1.13環(huán)境搭建》
https://juejin.im/post/5c83abb4f265da2da67c6173《ubuntu18.04+Pytorch+cuda10.1+cuDNN配置踩坑記》
http://www.itdecent.cn/p/3d56adca6829