Machine Learning 硬件投入調(diào)研

GPU

在HPC領(lǐng)域,GPU比CPU運(yùn)算速度快是顯而易見(jiàn)的。在此簡(jiǎn)單的調(diào)研了一下,如何挑選GPU。

[Tesla K40]
Tesla系列是N廠專門(mén)為HPC退出的GPU產(chǎn)品,無(wú)視頻輸出,僅能做計(jì)算。系列型號(hào)有K20, K40, K80。其中K40是最強(qiáng)單芯產(chǎn)品,K80是雙core。
從N廠給出的評(píng)測(cè)可以看出,在HPC計(jì)算中,K40的性能是CPU的10倍以上。

CPU:12 核,E5-2697v2 @ 2.70 GHz。64 GB 系統(tǒng)內(nèi)存,CentOS 6.2。GPU:?jiǎn)蝹€(gè) Tesla K80(啟用 Boost)或單個(gè) Tesla K40(啟用 Boost)
K40在amazon售價(jià)$3k,K80為$4k。K40國(guó)內(nèi)應(yīng)該在¥25k左右。
結(jié)論: 太貴,不實(shí)惠

[GeForce Titan X]
Titan X號(hào)稱是N廠“核彈”,GeForce最強(qiáng)顯卡。Titan X的運(yùn)算性能強(qiáng)于K40,但限制了雙精度運(yùn)算。
評(píng)測(cè)文章可參見(jiàn): 深度信仰對(duì)決:TitanX和TeslaK40c對(duì)陣Caffe深度學(xué)習(xí)其結(jié)論是Titan X在運(yùn)算性能上要比K40更高。
結(jié)論: Titan X的價(jià)格在¥8k左右,12G顯存,性價(jià)比較高

[GTX 970]
GTX系列是主流游戲顯卡,目前算起來(lái)性價(jià)比比較高的是GTX970(~¥2500),CUDA數(shù)量是Titan X的一半,一般為4G顯存。單從GPU來(lái)說(shuō),組3塊顯卡的機(jī)器比Titan X要更實(shí)惠,不過(guò)組多臺(tái)機(jī)器分布式就不太劃算,因?yàn)檫€要算上其他CPU主板電源一大堆,而且占地方。
結(jié)論: 可以在前期花比較少的錢(qián)達(dá)到不錯(cuò)的效果,后期不能大規(guī)模上。

【Updated】
GTX1080 是16年新出的卡,5600一塊,8G顯存,速度比老Titan快30%,經(jīng)濟(jì)實(shí)惠。新Pascal架構(gòu)Titan X是最好選擇,9000+一塊,但一直缺貨。后期采購(gòu)混合搭配新Titan X和GTX1080。

分布式

Jeff Dean在NIPS 2015的slides(Large-Scale Distributed Systems for Training Neural Networks)中講到了TensorFlow在分布式上的性能提升情況。主要結(jié)論為:
ImageNet Inception的訓(xùn)練使用50GPU,~40X提升
從描述來(lái)看,在幾十個(gè)replica的規(guī)模下,基本上性能提升是線性的。
結(jié)論: 在調(diào)研階段結(jié)束后,真正真正開(kāi)始上真實(shí)場(chǎng)景時(shí),組集群是非常有必要的

TF已經(jīng)被人跑在了spark上,spark可以直接跑在云服務(wù)器上,所以使用云服務(wù)器也是一個(gè)選擇。
不過(guò)目前個(gè)人認(rèn)為云服務(wù)器并不是一個(gè)很劃算的選擇,有如下幾個(gè)原因:
從CPU和GPU的運(yùn)算性能來(lái)看,需要非常多的CPU才能達(dá)到一塊GPU的性能,云主機(jī)在這方面算起來(lái)非常不劃算
spark也是個(gè)規(guī)模比較大的項(xiàng)目,坑多,目前團(tuán)隊(duì)并沒(méi)有太多實(shí)踐積累,應(yīng)盡量避免陷入處理各種spark的問(wèn)題的循環(huán)中,更專注于DL本身。

另外,阿里云的提供了HPC云服務(wù)器,但價(jià)格較高,網(wǎng)頁(yè)報(bào)價(jià)如下

結(jié)論: 使用云服務(wù)器搭建集群為時(shí)尚早,云HPC服務(wù)器太貴。

硬件投入的建議

硬件可以逐步升級(jí)

  • Step 0. 兩臺(tái)i7 CPU服務(wù)器 (Current)
  • Step 1. 單服務(wù)器,2 x GTX 970,要看現(xiàn)有的服務(wù)器能插幾塊 (需要確認(rèn)目前的主機(jī)是否支持)
  • Step 2. 用Titan X來(lái)組服務(wù)器
  • Step 3. 云服務(wù)商 or 自組集群

參考服務(wù)器Spec

(From 李沐's blog: GPU集群折騰手記)

(From 淘寶, 北京思騰合力科技有限公司)

Reference


(注:感謝您的閱讀,希望本文對(duì)您有所幫助。如果覺(jué)得不錯(cuò)歡迎分享轉(zhuǎn)載,但請(qǐng)先點(diǎn)擊 這里 獲取授權(quán)。本文由 版權(quán)印 提供保護(hù),禁止任何形式的未授權(quán)違規(guī)轉(zhuǎn)載,謝謝!)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容