亚洲精品午夜久久久,99久9视频,亚洲AV在线观看春色

總結(jié)

個人認為Nvidia顯卡目前依然是比較好的方案，使用AMD顯卡需要針對性的看具體用途并做測試，原因如下：

1 CUDA具備先發(fā)優(yōu)勢，開源生態(tài)成熟，可能在很長一段時間內(nèi)都是主流，其他的追隨者雖然提供類似的加速計算工具，很難得到廣泛的開源生態(tài)支持。

2 其他平臺的底層API，很難做到和CUDA接口完全一致，目前ROCm模仿的是英偉達9和10系列的顯卡的計算接口，可能還需要一些時間積累。

3 其他平臺的穩(wěn)定性也有所不足（可能導致人工開發(fā)維護成本增加），CUDA經(jīng)過很多年的積累，很多開源社區(qū)的使用也讓其發(fā)現(xiàn)和修復了很多bug，不只是計算平臺本身，可能還涉及系統(tǒng)、硬件等多方面，在沒有足夠的開源生態(tài)去幫助調(diào)試發(fā)現(xiàn)bug的時候，計算平臺廠商的工作量是非常大的。

4 成本優(yōu)勢相比維護成本微弱，虛擬幣挖礦的大潮過去后，顯卡價格落差在縮小，游戲性能相近的RTX 4080和RX7900XT，售價分別是8000和6000左右，并且價格方面可以通過二手顯卡、低配顯卡方面妥協(xié)，并且A卡很可能速度上也有犧牲，游戲性能相當?shù)目赡芘蹵I就會有一定的差距）

5 除了軟件生態(tài)不足，A卡連自家的顯卡目前支持度還非常有限，消費級顯卡只有兩款支持，目前最新的顯卡RX7900XT都不支持自己的計算平臺ROCm

名詞解釋

ROCm：AMD發(fā)布的GPU加速計算庫，只支持AMD顯卡,支持linux，據(jù)說windows也開始支持

DirectML：微軟發(fā)布GPU加速計算庫，據(jù)說支持AMD、NVIDIA等顯卡,只支持windows

CUDA：英偉達發(fā)布的GPU加速計算庫，只支持NVIDIA顯卡，支持windows和linux，下游軟件生態(tài)最成熟穩(wěn)定

三者橫向?qū)Ρ葏⒖假Y料：

有人使用過Tensorflow-DirectML嘛，性能和cuda或者rocm相比如何？

方案介紹

方案一Linux+ROCm

優(yōu)點：

1性價比略高

2 Pytorch2.0兼容

缺點：

1軟件生態(tài)不成熟，AMD早在2016年4月就發(fā)布了ROCm平臺，迄今已經(jīng)整整7年，但因為起步太晚，而且官方支持力度有限，盡管開源，卻一直沒能發(fā)展開來。

2部分底層接口尚未實現(xiàn)，還不能完全替代Linux+CUDA方案。

3目前支持的硬件非常有限，目前消費級顯卡僅僅支持老款的RX6900XT、RX6600、VII

方案二Windows+ROCm

參考鏈接：

7年了！AMD CUDA殺手ROCm終于登陸Windows、支持游戲顯卡

優(yōu)點：

暫無

缺點：

1下游軟件生態(tài)不成熟，目前所有基于pytorch的模型（如chatGLM）都無法用這種方式運行。雖然在今年4月14日，AMD宣布ROCm宣布支持windows，但是截止到6月25日，pytorch官方網(wǎng)站顯示windows系統(tǒng)下pytorch還不支持ROCm，需要持續(xù)關注

2支持的顯卡非常有限，目前windows下只支持Radeon Pro W6800、RX 6900 XT、RX 6600

方案三Windows+DirectML

參考鏈接

AMD GPU，PyTorch，Windows和DirectML

Enable PyTorch with DirectML on Windows

優(yōu)點：

1支持多種GPU

缺點：

1軟件支持十分匱乏，目前pytorch已經(jīng)更新到2.0，目前官方文檔描述DirectML只支持pytorch1.13，僅僅就chatGLM來說，官方文檔中要求pytorch版本大于1.10，如果只是運行chatGLM的推理，可能夠用（具體穩(wěn)定性如何，是否支持還需要進一步真機測試），只是可能未來程序升級可能會比較受限，比如用其他的更新的模型，對版本要求可能會更高。

方案四Windows+CPU

優(yōu)點：

1不借助顯卡加速，只用CPU計算，部分模型在CPU和GPU做推理速度差別不明顯，多數(shù)模型速度雖有明顯差異，但也能將就使用。

2硬件成本更低，必要的情況下可升級顯卡加快速度。

3軟件支持兼容性好，幾乎所有模型都支持CPU推理。

缺點：

1可以做推理，但是不適合做模型訓練。

方案五Windows+CUDA

優(yōu)點：

1基本上絕大多數(shù)的Nvidia顯卡都支持

2追求性價比可以考慮二手顯卡、低配顯卡

缺點：

1相比linux+CUDA，開源生態(tài)略顯不足，程序穩(wěn)定性略低

方案六Linux+CUDA

優(yōu)點：

1軟件生態(tài)完善，最活躍，目前流行的多卡并行計算的開源框架多數(shù)都是基于該方案

2基本上絕大多數(shù)的Nvidia顯卡都支持

3追求性價比可以考慮二手顯卡、低配顯卡

4穩(wěn)定性最高，減少后期維護成本

缺點：

暫無

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

2023年了，AMD顯卡做深度學習怎樣

2023年了，AMD顯卡做深度學習怎樣

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

2023年了，AMD顯卡做深度學習怎樣

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av