毫無疑問,GPU和AI加速器才是AI時代算力的最大提供者。訓(xùn)練AI模型需要GPU的超大算力,但一塊GPU越來越存不下今天的模型,互聯(lián)多塊GPU成了剛需,各種高端的網(wǎng)卡,DPU...
IP屬地:北京
毫無疑問,GPU和AI加速器才是AI時代算力的最大提供者。訓(xùn)練AI模型需要GPU的超大算力,但一塊GPU越來越存不下今天的模型,互聯(lián)多塊GPU成了剛需,各種高端的網(wǎng)卡,DPU...
五月份買了12代Alder Lake架構(gòu)的筆記本,CPU型號是i7 1280p,6大8小的配置。最近終于有機(jī)會研究一下這個架構(gòu)的特性,順便記錄一下感想。為了適配這個新的架構(gòu),...
本文作為上一篇文章(后面簡稱前文) M1 Max初相遇,快快樂樂寫卷積 - 簡書[http://www.itdecent.cn/p/043821d3033d?v=17353...
11月份入了M1 Max版本的MBP14,吃了兩個月灰,春節(jié)終于有時間體驗(yàn)了一下apple silicon的威力~ 這顆SoC的能力非??鋸?,有4發(fā)射SIMD的能力,同時緩存...
之前為了驗(yàn)證一個技術(shù)上的想法,隨手寫的一段匯編: https://github.com/pigirons/sgemm_hsw/blob/master/sgemm_kernel...
恩,這個系列的第一篇文章,先談點(diǎn)輕松的,常用CPU架構(gòu)浮點(diǎn)峰值的理論計算和實(shí)測。做性能優(yōu)化,先要知己知彼,了解自己優(yōu)化的CPU的能力上限。這樣優(yōu)化做到什么程度,心里會有數(shù)。 ...