GPU 初理解

GPU = 顯存 + 計(jì)算單元

1、顯存(Global Memory):顯存是在GPU板卡上的DRAM,類似于CPU的內(nèi)存,就是那堆DDR啊,GDDR5啊之類的。特點(diǎn)是容量大(可達(dá)16GB),速度慢,CPU和GPU都可以訪問。
2、計(jì)算單元(Streaming Multiprocessor, SM):執(zhí)行計(jì)算的。每一個(gè)SM都有自己的控制單元(Control Unit),寄存器(Register),緩存(Cache),指令流水線(execution pipelines)。

image-20190505194400541.png

CUDA core也叫Streaming Processor(SP),SM和SP一個(gè)意思

DP Unit:雙精度核心

GP100里,每一個(gè)SM有兩個(gè)SM Processing Block(SMP),里邊的綠色的就是CUDA Core,CUDA core也叫Streaming Processor(SP),這倆是一個(gè)意思。每一個(gè)SM有自己的指令緩存,L1緩存,共享內(nèi)存。而每一個(gè)SMP有自己的Warp Scheduler、Register File等。要注意的是CUDA Core是Single Precision的,也就是計(jì)算float單精度的。雙精度Double Precision是那個(gè)黃色的模塊。所以一個(gè)SM里邊由32個(gè)DP Unit,由64個(gè)CUDA Core,所以單精度雙精度單元數(shù)量比是2:1。LD/ST 是load store unit,用來內(nèi)存操作的。SFU是Special function unit,用來做cuda的intrinsic function的,類似于__cos()這種。

CUDA Core

image-20190505194927593.png

包括控制單元Dispatch Port、Operand Collector,以及浮點(diǎn)計(jì)算單元FP Unit、整數(shù)計(jì)算單元Int Unit,另外還包括計(jì)算結(jié)果隊(duì)列。當(dāng)然還有Compare、Logic、Branch等。相當(dāng)于微型CPU。

GPU內(nèi)存架構(gòu)

GPU架構(gòu)

越靠近SM的內(nèi)存就越快。

  1. L1 Cache:Pascal架構(gòu)上,L1 Cache和Texture已經(jīng)合為一體(Unified L1/Texture Cache),作為一個(gè)連續(xù)緩存供給warp使用。
  2. L2 Cache:用來做Global Memory的緩存,容量大,給整個(gè)GPU使用。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 1. CPU vs. GPU 1.1 四種計(jì)算機(jī)模型 GPU設(shè)計(jì)的初衷就是為了減輕CPU計(jì)算的負(fù)載,將一部分圖形計(jì)...
    王偵閱讀 21,365評論 3 20
  • 原文鏈接 最近在 iOS 開發(fā)中做了較多動畫相關(guān)的編程工作。因此想借此機(jī)會深入了解了一下 iOS 動畫及渲染相關(guān)原...
    baochuquan閱讀 12,134評論 2 15
  • 前言 (這篇文章是我本人很早之前發(fā)在百度貼吧的,所以完全不存在侵權(quán)問題。最近感覺需要存檔一下,萬一哪天貼吧倒掉了呢...
    LittleMagic閱讀 4,093評論 1 5
  • 深夜,窗外能見度還是很低,氣息和霧霾稀釋在一起,分不清。多想讓呼吸把溫暖傳遞給在遠(yuǎn)方的朋友,不知道你是否還是一如既...
    安xi帥的冢閱讀 221評論 0 0
  • 蝶水月秋千閱讀 181評論 0 0

友情鏈接更多精彩內(nèi)容