在當今數(shù)字化時代,GPU服務(wù)器已成為眾多行業(yè)不可或缺的計算資源。無論是深度學(xué)習(xí)、科學(xué)計算,還是圖形可視化、視頻處理,GPU服務(wù)器都以其強大的計算能力,為各行各業(yè)提供了高效、可靠的解決方案。本文將詳細介紹阿里云GPU服務(wù)器的優(yōu)惠價格、性能優(yōu)勢以及應(yīng)用場景,幫助您更好地了解和選擇適合自己的GPU服務(wù)器。

一、阿里云GPU服務(wù)器優(yōu)惠價格全覽
1. 按量付費價格優(yōu)惠
阿里云GPU服務(wù)器支持按量付費模式,用戶可以根據(jù)實際需求,按小時購買計算資源。為了回饋廣大用戶,阿里云推出了長達100小時的按量1折起優(yōu)惠活動。以下是部分實例規(guī)格的按量付費優(yōu)惠價格:
- AI推理/訓(xùn)練:16核60G+1張A10 24G顯存(gn7i-c16g1.4xlarge),最長100小時,優(yōu)惠價格1.9元/小時起。
- AI訓(xùn)練/推理:8核32G+1張V100 16G顯存(gn6v-c8g1.2xlarge),最長100小時,優(yōu)惠價格2.4元/小時起。
- AI推理:16核62G+1張T4 16G顯存(gn6i-c16g1.4xlarge),最長100小時,優(yōu)惠價格2.0元/小時起。
- AI推理/訓(xùn)練:4核30G+1張P100 16G顯存(gn5-c4g1.xlarge),最長100小時,優(yōu)惠價格1.2元/小時起。
阿里云gpu云服務(wù)器按量活動直達:https://t.aliyun.com/U/U3vQXc

2. 包年包月優(yōu)惠價格表
對于需要長期使用GPU服務(wù)器的用戶,阿里云提供了包年包月計費模式。用戶可以選擇購買1個月、6個月或1年等時長,享受更優(yōu)惠的價格。現(xiàn)在購買還可疊加使用阿里云折扣優(yōu)惠券,享受活動價格7.5折的實際優(yōu)惠價格,領(lǐng)券地址:https://t.aliyun.com/U/a23cv1

以下是部分實例規(guī)格的包年包月活動價格與使用折扣優(yōu)惠券之后的實際優(yōu)惠價格表:
| gpu實例規(guī)格 | 配置 | 顯存 | 內(nèi)存 | 活動價格 | 優(yōu)惠價格 |
|---|---|---|---|---|---|
| GPU 計算型 gn6i(ecs.gn6i-c4g1.xlarge) | 4 vCPU 15 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 1681.00元/1個月起 10164.00元/6個月起 16141.80元/1年起 |
1260.75元/1個月起 7623.00元/6個月起 12106.35元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c8g1.2xlarge) | 8 vCPU 31 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 2026.00元/1個月起 12216.00元/6個月起 19455.60元/1年起 |
1519.50元/1個月起 9162.00元/6個月起 14591.70元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c16g1.4xlarge) | 16 vCPU 62 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 2372.50元/1個月起 14235.00元/6個月起 22751.40元/1年起 |
1779.38元/1個月起 10676.25元/6個月起 17063.55元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c24g1.6xlarge) | 24 vCPU 93 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 2485.00元/1個月起 14892.00元/6個月起 23964.00元/1年起 |
1863.75元/1個月起 11169.00元/6個月起 17973.00元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c24g1.12xlarge) | 48 vCPU 186 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 4960.00元/1個月起 29742.00元/6個月起 47591.40元/1年起 |
3720.00元/1個月起 22306.50元/6個月起 35693.55元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c24g1.24xlarge) | 96 vCPU 372 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 9910.00元/1個月起 59460.00元/6個月起 95111.40元/1年起 |
7432.50元/1個月起 44595.00元/6個月起 71333.55元/1年起 |
| GPU 計算型 gn6i(ecs.gn6i-c40g1.10xlarge) | 40 vCPU 155 GiB | 16G顯存T4計算卡 | 最高配置372G DDR4內(nèi)存 | 3563.45元/1個月起 21398.71元/6個月起 34345.94元/1年起 |
2672.59元/1個月起 16049.03元/6個月起 25759.46元/1年起 |
| GPU 計算型 gn6v(ecs.gn6v-c8g1.2xlarge) | 8 vCPU 32 GiB | 16G顯存V100計算卡 | 最高配置336G DDR4內(nèi)存 | 3817.00元/1個月起 22902.00元/6個月起 36647.40元/1年起 |
2862.75元/1個月起 17176.50元/6個月起 27485.55元/1年起 |
| GPU 計算型 gn6v(ecs.gn6v-c8g1.4xlarge) | 16 vCPU 64 GiB | 16G顯存V100計算卡 | 最高配置336G DDR4內(nèi)存 | 7627.00元/1個月起 45840.00元/6個月起 73223.40元/1年起 |
5720.25元/1個月起 34380.00元/6個月起 54917.55元/1年起 |
| GPU 計算型 gn6v(ecs.gn6v-c8g1.8xlarge) | 32 vCPU 128 GiB | 16G顯存V100計算卡 | 最高配置336G DDR4內(nèi)存 | 15247.00元/1個月起 91500.00元/6個月起 146508.00元/1年起 |
11435.25元/1個月起 68625.00元/6個月起 109881.00元/1年起 |
| GPU 計算型 gn6v(ecs.gn6v-c8g1.16xlarge) | 64 vCPU 256 GiB | 16G顯存V100計算卡 | 最高配置336G DDR4內(nèi)存 | 30490.00元/1個月起 183000.00元/6個月起 292812.00元/1年起 |
22867.50元/1個月起 137250.00元/6個月起 219609.00元/1年起 |
| GPU 計算型 gn6v(ecs.gn6v-c10g1.20xlarge) | 82 vCPU 336 GiB | 16G顯存V100計算卡 | 最高配置336G DDR4內(nèi)存 | 31647.50元/1個月起 189825.00元/6個月起 303828.00元/1年起 |
23735.63元/1個月起 142368.75元/6個月起 227871.00元/1年起 |
| GPU 計算型 gn7i(ecs.gn7i-c32g1.8xlarge) | 32 vCPU 188 GiB | 24G顯存A10計算卡 | 最高配置752G DDR4內(nèi)存 | 3203.99元/1個月起 19223.94元/6個月起 30764.30元/1年起 |
2402.99元/1個月起 14417.96元/6個月起 23073.23元/1年起 |
| GPU計算型 gn5(ecs.gn5-c4g1.xlarge) | 4 vCPU 30 GiB | 16G顯存 | P100內(nèi)存 | 1847.50元/1個月起 11163.00元/6個月起 17872.80元/1年起 |
1385.63元/1個月起 8372.25元/6個月起 13404.60元/1年起 |
| GPU計算型 gn5(ecs.gn5-c8g1.2xlarge) | 8 vCPU 60 GiB | 16G顯存 | P100內(nèi)存 | 3688.50元/1個月起 22131.00元/6個月起 35413.80元/1年起 |
2766.38元/1個月起 16598.25元/6個月起 26560.35元/1年起 |
| GPU計算型 gn5(ecs.gn5-c8g1.4xlarge) | 16 vCPU 120 GiB | 16G顯存 | P100內(nèi)存 | 4453.00元/1個月起 26640.00元/6個月起 42628.20元/1年起 |
3339.75元/1個月起 19980.00元/6個月起 31971.15元/1年起 |
| GPU計算型 gn5(ecs.gn5-c8g1.8xlarge) | 32 vCPU 240 GiB | 16G顯存 | P100內(nèi)存 | 8885.50元/1個月起 53235.00元/6個月起 85180.20元/1年起 |
6664.13元/1個月起 39926.25元/6個月起 63885.15元/1年起 |
| GPU計算型 gn5(ecs.gn5-c8g1.14xlarge) | 54 vCPU 480 GiB | 16G顯存 | P100內(nèi)存 | 17738.00元/1個月起 106428.00元/6個月起 170421.60元/1年起 |
13303.50元/1個月起 79821.00元/6個月起 127816.20元/1年起 |
| GPU計算型 gn5(ecs.gn5-c28g1.7xlarge) | 28 vCPU 112 GiB | 16G顯存 | P100內(nèi)存 | 3445.50元/1個月起 20673.00元/6個月起 33081.00元/1年起 |
2584.13元/1個月起 15504.75元/6個月起 24810.75元/1年起 |
| GPU計算型 gn5(ecs.gn5-c28g1.14xlarge) | 56 vCPU 224 GiB | 16G顯存 | P100內(nèi)存 | 6883.50元/1個月起 41379.00元/6個月起 66085.80元/1年起 |
5162.63元/1個月起 31034.25元/6個月起 49564.35元/1年起 |
用戶可以根據(jù)自己的實際需求,選擇最合適的實例規(guī)格和購買時長,以享受最優(yōu)惠的價格。
3. 優(yōu)惠券與代金券
為了進一步降低用戶的使用成本,阿里云還提供了豐富的優(yōu)惠券和代金券。用戶可以在阿里云官網(wǎng)或相關(guān)活動頁面中領(lǐng)取這些優(yōu)惠券和代金券,并在購買GPU服務(wù)器時使用,以享受額外的折扣優(yōu)惠。
- 阿里云上云抵扣金、無門檻優(yōu)惠券、遷云補貼優(yōu)惠券:https://t.aliyun.com/U/RoZxpV
- 云小站平臺(云產(chǎn)品通用代金券、7.5折優(yōu)惠券、云服務(wù)器秒殺優(yōu)惠):https://www.aliyun.com/minisite/goods

二、阿里云GPU服務(wù)器性能詳解
1. 超強計算能力
阿里云GPU服務(wù)器配備業(yè)界超強算力的GPU計算卡,結(jié)合高性能CPU平臺,單實例可提供高達5PFLOPS的混合精度計算性能。這意味著,阿里云GPU服務(wù)器能夠輕松應(yīng)對各種復(fù)雜的計算任務(wù),為用戶提供高效、可靠的計算資源。
2. 網(wǎng)絡(luò)性能出色
阿里云GPU云服務(wù)器實例的VPC網(wǎng)絡(luò)最大支持2400萬的PPS(Packet Per Second,包每秒)及160Gbit/s的內(nèi)網(wǎng)帶寬。這使得阿里云GPU服務(wù)器在處理大量數(shù)據(jù)傳輸時,能夠保持高速、穩(wěn)定的網(wǎng)絡(luò)連接,滿足用戶對網(wǎng)絡(luò)性能的高要求。
3. 專用GPU軟件輔助工具
為了提升用戶的使用體驗,阿里云為GPU服務(wù)器提供了專用的GPU軟件輔助工具,如神龍AI加速訓(xùn)練引擎(AIACC-Training)、神龍AI加速推理引擎、FastGPU、容器共享GPU軟件和彈性加速計算實例(EAIS)等。
- 神龍AI加速訓(xùn)練引擎:支持Tensorflow, Pytorch, MXNet和Caffe四種分布式訓(xùn)練框架,針對阿里云環(huán)境進行了深度優(yōu)化,能夠顯著提升分布式訓(xùn)練效率。
- 神龍AI加速推理引擎:針對阿里云環(huán)境進行了深度優(yōu)化,能夠顯著提升GPU利用率,大幅提高推理業(yè)務(wù)性能。
- FastGPU:一套阿里云GPU實例集群極速部署工具,幫助用戶在阿里云上一鍵部署GPU計算資源。
- 彈性加速計算實例EAIS:一款可在Alibaba ECS實例中靈活添加GPU加速資源的彈性加速計算實例,滿足用戶靈活配比CPU和GPU資源的需求。
這些專用軟件輔助工具的使用,進一步提升了阿里云GPU服務(wù)器的性能和易用性,為用戶提供了更加便捷、高效的使用體驗。
三、阿里云GPU服務(wù)器應(yīng)用場景
GPU云服務(wù)器適用于視頻轉(zhuǎn)碼、圖片渲染、AI訓(xùn)練、AI推理、云端圖形工作站等場景,神行工具包(DeepGPU)為了配合GPU云服務(wù)器的計算服務(wù)增強能力,也適用于所有AI訓(xùn)練場景和AI推理場景。下面介紹GPU云服務(wù)器和神行工具包(DeepGPU)的具體應(yīng)用場景。
1、GPU云服務(wù)器應(yīng)用場景
1.1 直播實時視頻轉(zhuǎn)碼
阿里云GPU云服務(wù)器重點支持2019年天貓雙11狂歡夜直播的實時視頻轉(zhuǎn)碼,以高畫質(zhì)、低帶寬、高分辨率、實時的綜合優(yōu)勢服務(wù)于天貓雙11狂歡夜當天直播業(yè)務(wù)4K、2K、1080P等各個分辨率的轉(zhuǎn)碼。具體說明如下:
- GPU云服務(wù)器支持高并發(fā)實時視頻流5000路以上,并逐步上升到峰值6200路每分鐘,且順利度過流量洪峰。
- GPU云服務(wù)器參與實時家居渲染圖片生成等業(yè)務(wù),首次提供了大量算力強勁的ebmgn6v裸金屬實例,支持淘寶渲染方提升幾十倍的渲染性能,第一次實現(xiàn)秒級實時渲染,完成總計超過5000張大型家居渲染圖。
1.2 AI訓(xùn)練
GPU計算型實例規(guī)格族gn6v和gn6e具有優(yōu)異的通用GPU計算加速能力,適合為深度學(xué)習(xí)提供加速引擎。具體說明如下:
- gn6v實例配備具有16 GB顯存的NVIDIA V100 GPU計算卡,gn6e實例配備具有32 GB顯存的NVIDIA V100 GPU計算卡,單節(jié)點可提供高達1000 TFlops的混合精度計算能力。
- 實例與彈性計算生態(tài)的完美結(jié)合,為在線和離線場景提供了通用的解決方案。
- 實例搭配容器服務(wù)使用,可以簡化部署和運維的復(fù)雜度,提供資源調(diào)度服務(wù)。
1.3 AI推理
GPU計算型實例規(guī)格族gn6i具有優(yōu)異的AI推理能力,滿足了深度學(xué)習(xí)(尤其是推理)場景下的算力需求。具體說明如下:
- gn6i實例基于配備NVIDIA Tesla T4 GPU計算卡,單精度浮點計算能力最高可達8.1 TFlops,int8定點運算處理能力最高可達130 TOPS,支持混合精度。
- 單卡功耗僅75 W,具有極高的性能功耗比。
- 實例與彈性計算生態(tài)的完美結(jié)合,為在線和離線場景提供了通用的解決方案。
- 實例搭配容器服務(wù)使用,可以簡化部署和運維的復(fù)雜度,并提供資源調(diào)度服務(wù)。
- 鏡像市場提供預(yù)裝NVIDIA GPU驅(qū)動和深度學(xué)習(xí)框架的鏡像,簡化您的部署操作。
1.4 云端圖形工作站
GPU計算型實例規(guī)格族gn6i采用基于Turing架構(gòu)的NVIDIA Tesla T4 GPU加速器,具有極佳的圖形計算能力。gn6i實例可以結(jié)合云桌面產(chǎn)品提供云端圖形工作站服務(wù),應(yīng)用于影視動畫設(shè)計、工業(yè)設(shè)計、醫(yī)療成像、高性能計算的結(jié)果呈現(xiàn)等場景。
2、神行工具包(DeepGPU)應(yīng)用場景
神行工具包中的組件主要包括神龍AI加速引擎AIACC(AIACC-Training和AIACC-Inference)、AI分布式訓(xùn)練通信優(yōu)化庫AIACC-ACSpeed、AI訓(xùn)練計算優(yōu)化編譯器AIACC-AGSpeed、集群極速部署工具FastGPU以及GPU容器共享技術(shù)cGPU,該工具主要適用于AI訓(xùn)練和AI推理場景。具體說明如下:
2.1 AI訓(xùn)練
AIACC適用于所有AI訓(xùn)練場景和AI推理場景。AIACC-ACSpeed和AIACC-AGSpeed適用于所有基于PyTorch框架的AI訓(xùn)練場景,并針對PyTorch框架可以實現(xiàn)定制化的深度優(yōu)化功能。
AIACC進行AI訓(xùn)練的典型業(yè)務(wù)場景如下所示:
| 場景 | 適用模型 | 常用存儲 |
|---|---|---|
| 圖像分類、圖像識別 | MXNet框架的模型 | 并行文件存儲系統(tǒng)CPFS |
| CTR預(yù)估 | TensorFlow框架的Wide&Deep模型 | 文件系統(tǒng)HDFS |
| NLP自然語言處理 | TensorFlow框架的Transformer、Bert模型 | 并行文件存儲系統(tǒng)CPFS |
AIACC-ACSpeed進行AI訓(xùn)練的典型業(yè)務(wù)場景如下所示:
| 場景 | 適用模型 | 常用存儲 |
|---|---|---|
| 圖像分類、圖像識別 | Resnet、VGG16模型等,以及Stable Diffusion等AIGC模型 | 并行文件存儲系統(tǒng)CPFS |
| CTR預(yù)估 | Wide&Deep模型 | 文件系統(tǒng)HDFS |
| NLP自然語言處理 | Transformer、Bert模型等 | 并行文件存儲系統(tǒng)CPFS |
| 大模型 | Megatron-LM、DeepSpeed等混合并行的LLM大模型場景的Pretrain和Finetune | 并行文件存儲系統(tǒng)CPFS |
AGSpeed進行AI訓(xùn)練的典型業(yè)務(wù)場景如下所示:
| 場景 | 場景 |
|---|---|
| 適用模型 | 適用模型 |
| 圖像分類 | 圖像分類 |
| ResNet、MobileNet等模型 | ResNet、MobileNet等模型 |
| 圖像分割 | 圖像分割 |
| Unet3D等模型 | Unet3D等模型 |
| NLP自然語言處理 | NLP自然語言處理 |
| BERT、GPT2、T5等模型 | BERT、GPT2、T5等模型 |
2.2 AI推理
AIACC能夠適用于所有AI推理場景。該工具進行AI推理的典型業(yè)務(wù)場景如下所示:
| 場景 | 適用模型 | 配置信息 | 性能優(yōu)化措施 |
|---|---|---|---|
| 視頻超分推理 | 超分模型 | T4 GPU | 進行了如下性能優(yōu)化,將性能提升至原來的2.7倍。 視頻解碼移植到GPU。 前后處理移植到GPU。 自動湊滿一次運算所需的數(shù)據(jù)集大小。 卷積的深度優(yōu)化。 |
| 圖像合成在線推理 | GAN模型 | T4 GPU | 進行了如下性能優(yōu)化,將性能提升至原來的4倍。 前后處理移植到GPU。 自動湊滿一次運算所需的數(shù)據(jù)集大小。 卷積的深度優(yōu)化。 |
| CTR預(yù)估推理 | Wide&Deep模型 | M40 GPU | 進行了如下性能優(yōu)化,將性能提升至原來的6.1倍。 流水線優(yōu)化。 模型拆分。 子模型分別優(yōu)化。 |
| 自然語言處理推理 | Bert模型 | T4 GPU | 進行了如下性能優(yōu)化,將性能提升至原來的3.3倍。 前后處理流水線優(yōu)化。 自動湊滿一次運算所需的數(shù)據(jù)集大小。 Kernel深入優(yōu)化。 |
四、如何選擇適合的阿里云GPU服務(wù)器實例
在選擇阿里云GPU服務(wù)器實例時,用戶需要根據(jù)自己的實際需求和應(yīng)用場景進行綜合考慮。以下是一些選擇參考因素(續(xù)):
-
性能需求:
- 計算能力:根據(jù)應(yīng)用對計算能力的需求,選擇具有相應(yīng)CUDA核心數(shù)和Tensor核心數(shù)的GPU實例。例如,對于深度學(xué)習(xí)訓(xùn)練,需要選擇具有高計算能力的GPU,如P100、V100或更高級的A100等。
- 內(nèi)存大小:GPU內(nèi)存的大小直接影響能夠處理的數(shù)據(jù)量。對于大規(guī)模數(shù)據(jù)處理或需要加載大量模型參數(shù)的應(yīng)用,應(yīng)選擇具有較大內(nèi)存的GPU實例。
- 存儲性能:考慮數(shù)據(jù)讀寫速度的需求,選擇適合的存儲類型,如SSD或HDD,以及存儲帶寬和IOPS等性能參數(shù)。
-
成本效益:
- 實例價格:不同型號的GPU實例價格差異較大,用戶應(yīng)根據(jù)預(yù)算和應(yīng)用需求,選擇性價比最高的實例類型。
- 按需付費與包年包月:根據(jù)使用時長和靈活性需求,選擇按需付費或包年包月的計費方式。對于長期穩(wěn)定運行的應(yīng)用,包年包月可能更經(jīng)濟。
- 預(yù)留實例與搶占式實例:預(yù)留實例提供價格優(yōu)惠,但需要提前購買;搶占式實例價格更低,但可能隨時被回收。用戶應(yīng)根據(jù)自身需求選擇合適的實例類型。
-
可用性與可擴展性:
- 區(qū)域與可用區(qū):選擇靠近用戶或數(shù)據(jù)中心的區(qū)域和可用區(qū),以減少延遲和提高訪問速度。
- 網(wǎng)絡(luò)帶寬:根據(jù)應(yīng)用對網(wǎng)絡(luò)帶寬的需求,選擇具有相應(yīng)帶寬的實例。對于需要高速數(shù)據(jù)傳輸?shù)膽?yīng)用,如視頻處理或大數(shù)據(jù)分析,應(yīng)選擇高帶寬實例。
- 彈性伸縮:考慮未來業(yè)務(wù)增長的可能性,選擇支持彈性伸縮的實例類型,以便在需要時快速增加或減少計算資源。
-
技術(shù)支持與售后服務(wù):
- 技術(shù)支持:選擇提供全面技術(shù)支持的阿里云實例,以確保在應(yīng)用部署和運行過程中得到及時有效的幫助。
- 售后服務(wù):了解阿里云的售后服務(wù)政策,包括實例故障處理、數(shù)據(jù)恢復(fù)和退換貨等,以確保在使用過程中的權(quán)益得到保障。
綜上所述,選擇適合的阿里云GPU服務(wù)器實例需要綜合考慮性能需求、成本效益、可用性與可擴展性以及技術(shù)支持與售后服務(wù)等多個方面。用戶應(yīng)根據(jù)自身實際需求和應(yīng)用場景,仔細評估各種因素,選擇最適合的實例類型。同時,建議用戶在選擇前充分了解阿里云的實例類型和計費方式,以便做出更明智的決策。