作為阿里云彈性計算家族的一員,GPU云服務(wù)器結(jié)合了GPU計算力與CPU計算力,滿足您在人工智能、高性能計算、專業(yè)圖形圖像處理等場景中的需求。下面是阿里云GPU云服務(wù)器的一些產(chǎn)品知識和常見問題及官方解答資料,以供大家參考和了解阿里云GPU云服務(wù)器。

一、什么是GPU云服務(wù)器
GPU 云服務(wù)器(GPU Cloud Computing,GPU)是提供 GPU 算力的彈性計算服務(wù),具有超強的計算能力,服務(wù)于深度學(xué)習(xí)、科學(xué)計算、圖形可視化、視頻處理多種應(yīng)用場景。阿里云作為亞太第一的云服務(wù)提供商,隨時為您提供觸手可得的算力,有效緩解計算壓力,提升您的業(yè)務(wù)效率,助您提高企業(yè)競爭力。產(chǎn)品詳情鏈接:https://www.aliyun.com/product/ecs/gpu
GPU云服務(wù)器概念
| 名詞 | 說明 |
|---|---|
| GPU | 圖形處理器(Graphics Processing Unit)。相比CPU具有眾多計算單元和更多的流水線,適合用于大規(guī)模并行計算等場景。 |
| EGS | 彈性GPU服務(wù)(Elastic GPU Service)。阿里云彈性計算和GPU高速的并行異構(gòu)的加速器的組合服務(wù),兼具彈性計算的特點和GPU的加速能力。 |
| CUDA | NVIDIA推出的通用并行計算架構(gòu),幫助您使用NVIDIA GPU解決復(fù)雜的計算問題。 |
| cuDNN | NVIDIA推出的用于深度神經(jīng)網(wǎng)絡(luò)的GPU加速庫。 |
| AIACC-Training | 阿里云自研的AI加速器,可以顯著提升訓(xùn)練性能。 |
| AIACC-Inference | 阿里云自研的AI加速器,可以顯著提升推理性能。 |
| FastGPU | 阿里云推出的人工智能計算任務(wù)構(gòu)建工具,提供便捷的接口和命令行,供您在阿里云IaaS資源上構(gòu)建人工智能計算任務(wù)。 |
| cGPU | 隔離GPU資源,實現(xiàn)多個容器共用一張顯卡。 |
二、為什么選擇GPU云服務(wù)器
阿里云GPU云服務(wù)器是基于GPU與CPU應(yīng)用的計算服務(wù)器。GPU在執(zhí)行復(fù)雜的數(shù)學(xué)和幾何計算方面有著獨特的優(yōu)勢,特別是在浮點運算、并行運算等方面,GPU可以提供上百倍于CPU的計算能力。GPU的功能特性如下:
- 擁有大量擅長處理大規(guī)模并發(fā)計算的算術(shù)邏輯單元(Arithmetic and Logic Unit,即ALU)。
- 能夠支持多線程并行的高吞吐量運算。
- 邏輯控制單元相對簡單。
下表為您介紹GPU云服務(wù)器與自建GPU服務(wù)器的區(qū)別。
| 對比項 | GPU云服務(wù)器 | GPU自建服務(wù)器 | 對比項 |
|---|---|---|---|
| 靈活性 | 能夠快速開通一臺或多臺GPU云服務(wù)器實例。 實例規(guī)格(vCPU和內(nèi)存)支持靈活變更,并且支持在線升降配。 帶寬升降自由。 |
服務(wù)器購買周期長。 服務(wù)器規(guī)格固定,無法靈活變更。 帶寬一次性購買,無法自由升降。 |
靈活性 |
| 易用性 | Web在線管理,簡單方便。 內(nèi)置主流的操作系統(tǒng),Windows正版激活,且支持在線更換操作系統(tǒng)。 GPU驅(qū)動可以在購買時一并安裝,方便快捷。 |
沒有在線管理工具,維護困難。 需用戶自備操作系統(tǒng),自行安裝及更換。 GPU驅(qū)動需要自行購買安裝。 |
易用性 |
| 容災(zāi)備份 | 三副本數(shù)據(jù)設(shè)計,單份損壞可在短時間內(nèi)快速恢復(fù)。 硬件故障事故中可快速自動恢復(fù)。 |
用戶自行搭建,使用普通存儲設(shè)備,價格高昂。 數(shù)據(jù)損壞需用戶修復(fù)。 |
容災(zāi)備份 |
| 安全性 | 能夠有效阻止MAC欺騙和ARP攻擊。 并防護DDoS攻擊,可進行流量清洗和黑洞。 享有端口入侵掃描、掛馬掃描、漏洞掃描等附加服務(wù)。 |
很難阻止MAC欺騙和ARP攻擊。 清洗和黑洞設(shè)備需要另外購買,價格昂貴。 普遍存在漏洞掛馬和端口掃描等問題。 |
安全性 |
| 成本 | 支持包年包月及按量付費兩種購買方式,可靈活選擇適合您業(yè)務(wù)場景的付費方式。 按需購買,無需一次性大量投入。 |
無法按需購買,必須為業(yè)務(wù)峰值滿配。 一次性投入巨大,閑置浪費嚴重。 |
成本 |
三、阿里云GPU云服務(wù)器產(chǎn)品優(yōu)勢
1、覆蓋范圍廣闊
阿里云GPU云服務(wù)器在全球17個地域?qū)崿F(xiàn)規(guī)模部署,覆蓋范圍廣,結(jié)合彈性供應(yīng)、彈性伸縮等交付方式,能夠很好地滿足您業(yè)務(wù)的突發(fā)需求。
2、超強計算能力
阿里云GPU云服務(wù)器配備業(yè)界超強算力的GPU計算卡,結(jié)合高性能CPU平臺,單實例可提供高達1000 TFLOPS的混合精度計算性能。
3、網(wǎng)絡(luò)性能出色
阿里云GPU云服務(wù)器實例的VPC網(wǎng)絡(luò)最大支持450萬的PPS及32 Gbit/s的內(nèi)網(wǎng)帶寬。在此基礎(chǔ)上,超級計算集群產(chǎn)品中,節(jié)點間額外提供高達50 Gbit/s的RDMA網(wǎng)絡(luò),滿足節(jié)點間數(shù)據(jù)傳輸?shù)牡脱訒r高帶寬要求。
4、購買方式靈活
支持靈活的資源付費模式,包括包年包月、按量付費、搶占式實例、預(yù)留實例券、存儲容量單位包。用戶可以按需要購買,避免資源浪費。
阿里云GPU云服務(wù)器計費方式
GPU云服務(wù)器的計費相關(guān)功能和云服務(wù)器ECS一致,其中,計算資源(vCPU和內(nèi)存)、鏡像、塊存儲、公網(wǎng)帶寬以及快照等資源涉及計費。常見的計費方式如下所示:
- 包年包月:按一定時長購買資源,先付費后使用。
- 按量付費:按需開通和釋放資源,先使用后付費。
- 搶占式實例:通過競價模式搶占庫存充足的計算資源,相對按量付費實例有一定的折扣,但是存在回收機制。
- 預(yù)留實例券:搭配按量付費實例使用的抵扣券,承諾使用指定配置的實例(包括實例規(guī)格、地域可用區(qū)等),以折扣價抵扣計算資源的賬單。
- 節(jié)省計劃:搭配按量付費實例使用的折扣權(quán)益計劃,承諾使用穩(wěn)定數(shù)量的資源(以元/小時為單位衡量),以折扣價抵扣計算資源、系統(tǒng)盤等資源的賬單。
- 存儲容量單位包:搭配按量付費存儲產(chǎn)品使用的資源包,承諾使用指定容量的存儲資源,以折扣價抵扣塊存儲、NAS、OSS等資源的賬單。
一臺GPU實例包括計算資源(vCPU和內(nèi)存)、鏡像、塊存儲等資源,其中涉及計費的GPU資源如下表所示。
| 計費項 | 計費說明 | 計費方式 | 轉(zhuǎn)換計費方式 | 計費標準 |
|---|---|---|---|---|
| 計算資源(vCPU和內(nèi)存) | 即實例規(guī)格涉及的計算資源費用(包括vCPU和內(nèi)存)。 | 包年包月 按量付費 按量付費+預(yù)留實例券 搶占式實例 按量付費+節(jié)省計劃 |
包年包月轉(zhuǎn)按量付費 按量付費轉(zhuǎn)包年包月 |
實例規(guī)格計費 |
| 鏡像 | 根據(jù)鏡像類型以及使用情況決定是否收費。例如,公共鏡像、自定義鏡像、共享鏡像或鏡像市場鏡像的計費情況也有所區(qū)別。 | 包年包月 按量付費 按量付費+預(yù)留實例券 |
不支持 | 鏡像計費 |
| 塊存儲 | 云盤:根據(jù)單價、云盤容量和使用時長收取費用,并且創(chuàng)建云盤的方式不同會影響支持的計費方式。 本地盤:與特定實例規(guī)格綁定的本地盤,不支持單獨購買,且費用已計入實例規(guī)格費用。 |
包年包月 按量付費 存儲容量單位包 按量付費+節(jié)省計劃 |
轉(zhuǎn)換云盤計費方式 包年包月轉(zhuǎn)按量付費 按量付費轉(zhuǎn)包年包月 |
塊存儲計費 |
| 公網(wǎng)帶寬 | 使用固定公網(wǎng)IP訪問公網(wǎng)時,僅收取公網(wǎng)出網(wǎng)帶寬費用。 使用彈性公網(wǎng)IP(EIP)或NAT網(wǎng)關(guān)訪問公網(wǎng)時,彈性公網(wǎng)IP(EIP)和NAT網(wǎng)關(guān)是需要獨立購買。 |
按固定帶寬計費 按使用流量計費 |
轉(zhuǎn)換公網(wǎng)帶寬計費方式 | 公網(wǎng)帶寬計費 |
| 快照 | 快照的計費項目包括快照、快照復(fù)制以及快照極速可用。計費時會按快照容量和存儲時長收取費用。 | 快照的計費項目包括快照、快照復(fù)制以及快照極速可用。計費時會按快照容量和存儲時長收取費用。 | 不支持 | 快照計費 |
四、阿里云GPU云服務(wù)器應(yīng)用場景
1、直播實時視頻轉(zhuǎn)碼
阿里云異構(gòu)GPU和FPGA服務(wù)器重點支持2019年天貓雙11狂歡夜直播的實時視頻轉(zhuǎn)碼,以高畫質(zhì)、低帶寬、高分辨率、實時的綜合優(yōu)勢服務(wù)天貓雙11狂歡夜當(dāng)天直播業(yè)務(wù)4K、2K、1080P等各個分辨率的轉(zhuǎn)碼。其中FPGA H.265高清編碼、720P節(jié)省帶寬21.6%,GPU云服務(wù)器支持高并發(fā)實時視頻流5000路以上,并逐步上升到峰值6200路每分鐘,且順利度過流量洪峰。異構(gòu)GPU云服務(wù)器還參與實時家居渲染圖片生成等業(yè)務(wù),首次提供了大量算力強勁的ebmgn6v裸金屬實例,支持淘寶渲染方提升幾十倍的渲染性能,第一次實現(xiàn)秒級實時渲染,完成總計超過5000張大型家居渲染圖。異構(gòu)FPGA圖片轉(zhuǎn)碼業(yè)務(wù)則以3K+片的超大集群,為淘寶圖片空間提供高達數(shù)百萬QPS的處理能力,承擔(dān)了雙十一淘寶圖片85%的流量,預(yù)計節(jié)省計算成本3億。
2、AI訓(xùn)練
gn6v和gn6e具有優(yōu)異的通用GPU計算加速能力,適合為深度學(xué)習(xí)提供加速引擎。
gn6v和gn6e實例分別配備具有16 GB顯存和32 GB顯存的NVIDIA V100 GPU計算卡,單節(jié)點可提供高達1000TFLOPS的混合精度計算能力。與彈性計算生態(tài)的完美結(jié)合,為在線和離線場景提供了通用的解決方案。搭配容器服務(wù)使用,可以簡化部署和運維的復(fù)雜度,并提供資源調(diào)度服務(wù)。
3、AI推理
gn6i具有優(yōu)異的AI推理能力。
gn6i實例基于配備NVIDIA Tesla T4 GPU計算卡,單精度浮點計算能力最高可達8.1 TFLOPS,int8定點運算處理能力最高可達130 TOPS,支持混合精度,滿足了深度學(xué)習(xí)(尤其是推理)場景下的算力需求。同時單卡功耗僅75 W,具有極高的性能功耗比。與彈性計算生態(tài)的完美結(jié)合,為在線和離線場景提供了通用的解決方案。搭配容器服務(wù)使用,可以簡化部署和運維的復(fù)雜度,并提供資源調(diào)度服務(wù)。鏡像市場提供預(yù)裝NVIDIA GPU驅(qū)動和深度學(xué)習(xí)框架的鏡像,簡化您的部署操作。
4、云游戲、云網(wǎng)吧和云端圖形工作站
vgn6i和gn6i均采用基于Turing架構(gòu)的NVIDIA Tesla T4 GPU加速器,具有極佳的圖形計算能力。vgn6i提供分片虛擬化后的虛擬GPU,支持T4 GPU計算能力的1/2、1/4、1/8,并提供極佳的3D圖像渲染能力,適用于云游戲、云網(wǎng)吧等場景。vgn6i和gn6i實例可以結(jié)合云桌面產(chǎn)品提供云端圖形工作站服務(wù),應(yīng)用于影視動畫設(shè)計、工業(yè)設(shè)計、醫(yī)療成像、高性能計算的結(jié)果呈現(xiàn)等場景。
五、阿里云GPU云服務(wù)器使用限制
GPU實例作為云服務(wù)器ECS的一類實例規(guī)格,保持了與ECS實例相同的使用限制。使用云服務(wù)器ECS有下列限制:
- 僅彈性裸金屬服務(wù)器和超級計算集群支持二次虛擬化,其他規(guī)格族不支持安裝虛擬化軟件和二次虛擬化。
- 不支持聲卡應(yīng)用。
- 不支持直接加載外接硬件設(shè)備(如硬件加密狗、U盤、外接硬盤、銀行UKey等),您可以嘗試軟件加密狗或者動態(tài)口令二次驗證等。
- 不支持多播協(xié)議。如果需要使用多播,建議改為使用單播點對點方式。
- 日志服務(wù)不支持32位Linux系統(tǒng)云服務(wù)器。
- 如果云服務(wù)器需要備案,則云服務(wù)器有購買要求,且每臺ECS實例可申請的備案服務(wù)號數(shù)量有限。
- 部分軟件或應(yīng)用的許可證(License)需要與云服務(wù)器的硬件信息綁定。當(dāng)云服務(wù)器進行遷移操作時可能會引起硬件信息的變更,進而導(dǎo)致License失效。
六、阿里云GPU云服務(wù)器實例規(guī)格族有哪些?
實例是能夠為您的業(yè)務(wù)提供計算服務(wù)的最小單位,不同的實例規(guī)格可以提供的計算能力也不同。根據(jù)業(yè)務(wù)場景和使用場景,ECS實例可以分為多種實例規(guī)格族,GPU實例屬于ECS實例中的一類實例規(guī)格。GPU實例在提供GPU加速能力的同時,保留了與普通ECS實例一致的使用體驗。在創(chuàng)建ECS實例時,請選擇企業(yè)級異構(gòu)計算規(guī)格族群、彈性裸金屬服務(wù)器和超級計算集群(SCC)實例規(guī)格族群下的GPU實例規(guī)格即可。
1、企業(yè)級異構(gòu)計算規(guī)格族群
- GPU虛擬化型實例規(guī)格族sgn7i-vws(共享CPU)
- GPU虛擬化型實例規(guī)格族vgn7i-vws
- GPU計算型實例規(guī)格族gn7e
- GPU計算型實例規(guī)格族gn7i
- GPU計算型實例規(guī)格族gn7s
- GPU計算型實例規(guī)格族gn7
- GPU計算型實例規(guī)格族gn7r
- GPU虛擬化型實例規(guī)格族vgn6i/vgn6i-vws
- GPU計算型實例規(guī)格族gn6i
- GPU計算型實例規(guī)格族gn6e
- GPU計算型實例規(guī)格族gn6v
- 異構(gòu)服務(wù)型實例規(guī)格族video-trans
- FPGA計算型實例規(guī)格族f3
- 視覺計算型實例規(guī)格族ebmgi6s
- GPU虛擬化型實例規(guī)格族vgn5i
- GPU計算型實例規(guī)格族gn5
- GPU計算型實例規(guī)格族gn5i
2、彈性裸金屬服務(wù)器和超級計算集群(SCC)實例規(guī)格族群
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7ex
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7vx
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7e
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7ix
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7i
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn6ia
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn6e
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn6v
- GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn6i
- 計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmc7
- 計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmc7a
- 計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmc6me
- 計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmc6a
- 計算型(平衡增強)彈性裸金屬服務(wù)器實例規(guī)格族ebmc6e
- 計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmc6
- 存儲增強型彈性裸金屬服務(wù)器實例規(guī)格族ebmg7se
- 通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmg7
- 通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmg7a
- 通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmg6a
- 通用型(平衡增強)彈性裸金屬服務(wù)器實例規(guī)格族ebmg6e
- 通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmg6
- 內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmr7
- 內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmr7a
- 內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmr6a
- 內(nèi)存型(平衡增強)彈性裸金屬服務(wù)器實例規(guī)格族ebmr6e
- 內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmr6
- 持久內(nèi)存增強型彈性裸金屬服務(wù)器實例規(guī)格族ebmre6p
- 內(nèi)存增強型彈性裸金屬服務(wù)器實例規(guī)格族ebmre6-6t
- 高主頻通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfg7
- 高主頻計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfc7
- 高主頻內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfr7
- 高主頻通用型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfg6
- 高主頻計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfc6
- 高主頻內(nèi)存型彈性裸金屬服務(wù)器實例規(guī)格族ebmhfr6
- 本地SSD型彈性裸金屬服務(wù)器實例規(guī)格族ebmi2g
- 通用型超級計算集群實例規(guī)格族sccg7
- 計算型超級計算集群實例規(guī)格族sccc7
- 高主頻計算型超級計算集群實例規(guī)格族scchfc6
- 高主頻通用型超級計算集群實例規(guī)格族scchfg6
- 高主頻內(nèi)存型超級計算集群實例規(guī)格族scchfr6
- 高主頻型超級計算集群實例規(guī)格族scch5
- 通用型超級計算集群實例規(guī)格族sccg5
- GPU計算型超級計算集群實例規(guī)格族sccgn7ex
- GPU計算型超級計算集群實例規(guī)格族sccgn6e
- GPU計算型超級計算集群實例規(guī)格族sccgn6
七、阿里云GPU云服務(wù)器最新政策
1、新人/首購活動:僅限GPU產(chǎn)品新用戶參與,即在阿里云首次購買GPU云服務(wù)器的用戶。首次購買GPU云服務(wù)器如下配置包月5折,1/2年4折,限1次,限1臺(該優(yōu)惠不含帶寬,系統(tǒng)盤,數(shù)據(jù)盤):
gn6i(4核15G/8核31G/16核62G/24核93G/40核155G/48核186G/96核372G)
gn6v(8核32G/32核128G/64核256G/82核336G)
gn7i(32核188G)
2、官網(wǎng)折扣活動:GPU產(chǎn)品新用戶或老用戶均可參與,包含新購和續(xù)費。
(1)購買/續(xù)費GPU云服務(wù)器如下配置包月6折,1年 4.5折;2年 3.7折;3-5年 2.9折,不限制購買數(shù)量。(該優(yōu)惠不含帶寬,系統(tǒng)盤,數(shù)據(jù)盤):
gn6v(8核32G/32核128G/64核256G/82核336G)
(2)購買/續(xù)費GPU云服務(wù)器如下配置1年 5折;2年 4.1折;3-5年 3.2折,不限制購買數(shù)量。(該優(yōu)惠不含帶寬,系統(tǒng)盤,數(shù)據(jù)盤):
gn6i(4核15G/8核31G/16核62G/24核93G/40核155G/48核186G/96核372G)
3、官網(wǎng)目錄價直降
調(diào)整范圍說明:
(1)A10 c8g1系列及c16g1系列(包含ecs.gn7i-c8g1.2xlarge 、ecs.gn7i-c16g1.4xlarge),中國內(nèi)地地域(不含河源)列表價降低25%,河源地域降低32.5%。
(2)A10 c32g1系列(包含ecs.gn7i-c32g1.8xlarge 、ecs.gn7i-c32g1.16xlarge 、ecs.gn7i-c32g1.32xlarge)和A10裸金屬實例(ecs.ebmgn7i.32xlarge),中國內(nèi)地地域(不含河源)列表價降低11%,河源地域降低19.9%。
以上降幅包含月價、小時價、預(yù)留實例券及節(jié)省計劃。
更多配置阿里云服務(wù)器詳細活動價格查詢:https://www.aliyun.com/daily-act/ecs/activity_selection

八、阿里云gpu常見問題及解答
1、為什么Windows操作系統(tǒng)不支持DirectX等功能?
由于Windows自帶的遠程連接(RDP)協(xié)議本身并不支持DirectX、OpenGL等相關(guān)應(yīng)用。因此,您需要自行安裝TightVNC服務(wù)和客戶端,或其它支持PCOIP、XenDesktop HDX 3D等協(xié)議的遠程連接客戶端。
2、GPU實例支持安卓模擬器嗎?
僅GPU計算型彈性裸金屬服務(wù)器實例規(guī)格族ebmgn7e、ebmgn7ex、ebmgn7i、ebmgn7、ebmgn6ia、ebmgn6e、ebmgn6v、ebmgn6i以及sccgn7ex支持安卓模擬器,其他類型的GPU實例不支持安卓模擬器。
3、我能變更GPU實例的配置嗎?
除以下GPU實例規(guī)格族不支持變配外,其他GPU實例規(guī)格族均支持本規(guī)格族內(nèi)的變配操作。
- 帶本地存儲的GPU實例:gn5
- GPU虛擬化型實例:vgn5i
4、按量付費GPU實例支持節(jié)省停機模式嗎?
帶本地存儲的GPU實例規(guī)格族不支持按量付費實例節(jié)省停機模式,例如gn5。
5、如何查看GPU監(jiān)控數(shù)據(jù)?
您可以通過云監(jiān)控控制臺或DescribeMetricList查看GPU監(jiān)控數(shù)據(jù)。
6、如何在GPU實例和普通ECS實例間傳輸數(shù)據(jù)?
GPU實例除GPU加速能力外,保留了與普通ECS實例一致的使用體驗。同一安全組內(nèi)的GPU實例和ECS實例之間默認內(nèi)網(wǎng)互通,無需特別設(shè)置。
7、GPU與CPU有什么區(qū)別?
GPU與CPU的對比如下表所示:
| 對比項 | GPU | CPU |
|---|---|---|
| 算術(shù)運算單元(ALU) | 擁有大量擅長處理大規(guī)模并發(fā)計算的算術(shù)運算單元(ALU)。 | 擁有強大的算術(shù)運算單元(ALU),但數(shù)量較少。 |
| 邏輯控制單元 | 擁有相對簡單的邏輯控制單元。 | 擁有復(fù)雜的邏輯控制單元。 |
| 緩存 | 擁有很少的緩存,且緩存用于服務(wù)線程,而不是用于保存訪問的數(shù)據(jù)。 | 擁有大量的緩存結(jié)構(gòu),能夠?qū)?shù)據(jù)保存至緩存,從而提高訪問速度,降低時延。 |
| 響應(yīng)方式 | 需要將全部任務(wù)整合后,再進行批處理。 | 實時響應(yīng),對單個任務(wù)的響應(yīng)速度較高。 |
| 適用場景 | 適用于計算密集,相似度高,且多線程并行的高吞吐量運算場景。 | 適用于對響應(yīng)速度有要求,且邏輯復(fù)雜的串行運算場景。 |
8、普通ECS實例規(guī)格族是否支持升級或變更為GPU實例規(guī)格族?
普通ECS實例規(guī)格族不支持直接升級或變更為GPU實例規(guī)格族。
如果您的業(yè)務(wù)涉及AI推理相關(guān)內(nèi)容,您可以購買彈性加速計算實例EAIS,通過該服務(wù)實現(xiàn)為ECS實例遠程增加GPU顯卡的效果。EAIS能夠?qū)PU資源與GPU資源解耦,幫助您將GPU資源附加到ECS實例上,構(gòu)建成您希望得到的GPU實例規(guī)格。
9、Windows操作系統(tǒng)的GPU實例安裝GRID驅(qū)動后,通過控制臺VNC遠程連接實例出現(xiàn)黑屏怎么辦?
原因:當(dāng)Windows操作系統(tǒng)的GPU實例安裝了GRID驅(qū)動后,VM的顯示輸出被GRID驅(qū)動接管,VNC無法再獲取到集成顯卡的畫面,因此,VNC顯示會變成黑屏狀態(tài),屬于正?,F(xiàn)象。
解決辦法:使用Workbench連接GPU實例。
10、為什么購買GPU實例后,執(zhí)行命令nvidia-smi找不到GPU顯卡?
當(dāng)您執(zhí)行命令nvidia-smi無法找到GPU顯卡時,通常是由于您的GPU實例未安裝或者未成功安裝NVIDIA驅(qū)動。請根據(jù)您所購買的GPU實例規(guī)格選擇對應(yīng)的操作指引來安裝驅(qū)動,具體說明如下:
- 如果您購買的是GPU虛擬化型實例,請務(wù)必安裝GRID驅(qū)動。
- 如果您購買的是GPU計算型實例,可以安裝GPU驅(qū)動。
11、如何查詢GPU顯卡的詳細信息?
不同操作系統(tǒng)的GPU實例,查看GPU顯卡信息的操作有所區(qū)別,具體說明如下:
- 如果您的GPU實例安裝了Linux操作系統(tǒng),您可以執(zhí)行命令nvidia-smi,查詢GPU顯卡的詳細信息。
- 如果您的GPU實例安裝Windows操作系統(tǒng),您可以在設(shè)備管理器中查看GPU顯卡的詳細信息。
- 如果您需要了解GPU顯卡的空閑率、使用率、溫度以及功率等信息,可以前往云監(jiān)控控制臺查看。
12、普通ECS實例可以增加GPU顯卡嗎?
如果您的業(yè)務(wù)涉及AI推理相關(guān)內(nèi)容,您需要購買彈性加速計算實例EAIS,該服務(wù)能夠?qū)PU資源與GPU資源解耦,幫助您將GPU資源附加到ECS實例上,構(gòu)建成您希望得到的GPU實例規(guī)格,從而實現(xiàn)為ECS實例遠程增加GPU顯卡。
13、為什么創(chuàng)建GPU實例時選擇的CUDA版本與安裝完成后查看到的CUDA版本不一致?
您執(zhí)行命令nvidia-smi查詢到的CUDA版本代表您的GPU實例能夠支持的最高CUDA版本,并不代表您創(chuàng)建GPU實例時選擇的CUDA版本。
14、在GPU計算型實例上使用OpenGL、Direct3D等工具做圖形計算時,需要安裝什么驅(qū)動?
請根據(jù)您使用的GPU實例的操作系統(tǒng)安裝對應(yīng)的驅(qū)動,具體說明如下所示:
- 如果您使用的是Linux操作系統(tǒng),請安裝GPU驅(qū)動。
- 如果您使用的是Windows操作系統(tǒng),請前往云市場購買配備了GRID驅(qū)動的鏡像,如Windows Server 2019 中文版預(yù)裝GRID驅(qū)動鏡像、Windows Server 2016 中文版預(yù)裝GRID驅(qū)動鏡像,然后再手動安裝即可。
15、如何獲取GRID License?
請根據(jù)您使用的操作系統(tǒng)查看對應(yīng)的獲取方式,具體說明如下所示:
- 如果您需要在Windows操作系統(tǒng)的GPU實例上安裝GRID驅(qū)動,請前往云市場購買配備了GRID驅(qū)動的鏡像,如Windows Server 2019 中文版預(yù)裝GRID驅(qū)動鏡像、Windows Server 2016 中文版預(yù)裝GRID驅(qū)動鏡像,然后再手動安裝即可。
- 如果您需要在Linux操作系統(tǒng)的GPU虛擬化型實例上安裝GRID驅(qū)動,請先提交工單獲取GRID License,再手動安裝GRID驅(qū)動。
16、如何安裝cGPU服務(wù)?
無論您是企業(yè)認證用戶還是個人實名認證用戶,推薦您通過ACK的共享GPU組件使用cGPU服務(wù)。
17、更換操作系統(tǒng)時,如何取消自動安裝GPU驅(qū)動?
在創(chuàng)建GPU實例時,如果選擇了安裝GPU驅(qū)動選項,則創(chuàng)建實例后會自動安裝GPU驅(qū)動。如果您需要更換該實例的操作系統(tǒng),并且需要同時取消自動安裝GPU驅(qū)動的功能,請參考以下操作步驟:
- 停止GPU實例。
- 在實例列表中,找到已停止的GPU實例,在對應(yīng)操作列,選擇icon1 > 實例設(shè)置 > 設(shè)置用戶數(shù)據(jù)。
- 在用戶數(shù)據(jù):區(qū)域,刪除用戶數(shù)據(jù)內(nèi)容,然后單擊確定。
- 更換GPU實例的操作系統(tǒng)。
更換操作系統(tǒng)的本質(zhì)是更換系統(tǒng)盤,您可以通過更換實例的鏡像來更換操作系統(tǒng)。