姓名:呂烜威? ? ?學號:20021210973? ? ?學院:電子工程學院
轉(zhuǎn)載自:ARM兩大全新平臺誕生:性能飛躍4倍!?
【嵌牛導讀】CPU,是IT行業(yè)的制高點,既是各大IT公司角力的主戰(zhàn)場,背后還是各國政府科技競賽的競技場,40年江湖,你方唱罷我登場,好不熱鬧。在進入CPU時代前的史前時代,?是計算機從發(fā)明到大發(fā)展的計算機時代,?包含機械計算機、電動計算機、電子管計算機、晶體管計算機、集成電路計算機等幾個次世代,?這是一個屬于IBM的光輝時代,?也標志著人類進入電腦逐步解放人腦的智能時代。
【嵌牛鼻子】處理器? ARM? 計算機? ? ARMv9指令集
【嵌牛提問】ARMv9指令集的發(fā)布帶來了哪些影響?
【嵌牛正文】ARM兩大全新平臺誕生:性能飛躍4倍!
3月底,ARM正式發(fā)布了ARMv9指令集,號稱十年來最重要的創(chuàng)新,在兼容現(xiàn)有ARMv8的基礎上,重點強化了安全性、矢量計算、機器學習、數(shù)字信號處理,同時繼續(xù)加強性能,IPC提升幅度高達30%。
現(xiàn)在,ARM又發(fā)布了第一個基于ARMv9指令集架構(gòu)的平臺“ARM Neoverse N2”,在安全性、能耗、性能等方面都有全面的提升,可為新一代基礎設施核心鋪平道路。
Neoverse N系列平臺最為注重性能的擴展性、平衡性,特別針對單位功耗、單位面積的性能,以及單位功耗、面積的核心數(shù)。
相比主要搭檔7nm工藝的上代平臺N1,新一代N2最佳搭檔是5nm,兩相對比在保持相同水平的功率、面積效率的基礎上,N2的IPC同頻性能(約等于單線程性能)可提升達40%,而頻率也可以提高10%。
N2平臺可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣、5G應用場景,且性能提升明顯,例如在云端上提升1.3倍的NGINX,在5G和邊緣應用上提升1.2倍的DPDK數(shù)據(jù)包處理,以及提升1.4倍的SPECint2006。
N2平臺內(nèi)部集成了ARMv9.0-A CPU核心、指令集單元、64KB一級指令緩存、64KB一級數(shù)據(jù)緩存、512KB/1MB ECC二級緩存、異步橋接(Async Bridges)、AMBA 5 CHI直接連接、CoreSight等模塊,微架構(gòu)全方位改進,重點增強基準測試、實際服務器工作負載。、
而在外部系統(tǒng)連接中,它可以支持DDR5內(nèi)存、PCIe 5.0總線、HBM3高帶寬內(nèi)存,等等。
N2還是第一個具備SVE2功能的平臺,可為云到邊緣的性能效率帶來巨大的提升,比如機器學習、數(shù)字信號處理、多媒體、5G等場景中,還具備編程簡易性、可移植性等優(yōu)勢。
SMT同步多線程是如今處理器架構(gòu)設計的一個核心要素,不過另一方面,在云端等共享環(huán)境中,專屬內(nèi)核可以提供更具可預測性、確定性的性能,而且更有利于抵御常見的側(cè)信道攻擊,這也是N2的理念。
同時,它維持了相同的功耗、面積效率,加入了性能定義功耗管理(PDP)。
N2平臺起步就是32核心32線程,最多可以做到128核心128線程,對比N1平臺翻了一番,同時比傳統(tǒng)架構(gòu)的64核心128線程更具競爭力。
生態(tài)方面,Marvell美滿電子已經(jīng)發(fā)布了基于Neoverse N2平臺的OCTEON系列網(wǎng)絡解決方案,預計2021年底前試產(chǎn),相比上代性能提升高達3倍。
阿里云在即將上線的Arm架構(gòu)ECS實例上已經(jīng)完成測試,SPECjbb測試數(shù)據(jù)表現(xiàn)驚艷,而且基于ARM架構(gòu)運行的DragonWell JDK性能提高了 50%。
騰訊也在硬件測試和軟件支持方面持續(xù)投入,云應用上已經(jīng)可以采用ARM Neoverse技術(shù)。
同時,ARM今天還發(fā)布了全新的計算平臺“ARM Neoverse V1”。
這是ARM設計的第一個支持SVE(可伸縮矢量擴展)的內(nèi)核,可為高性能計算、機器學習帶來大幅度的性能提升。
ARM N系列是注重平衡性、高能效的平臺,ARM V系列則是追求極致性能,具備更大的緩沖、緩存、窗口、隊列設計,擁有更大的帶寬、面積、功耗。
基于性能至上的理念,V1平臺創(chuàng)造了ARM迄今為止最寬的微架構(gòu),可容納更多運行指令,支持高性能和百萬兆級計算,再加上SVE功能,V1在單核性能上優(yōu)勢十分明顯,全方位碾壓N2平臺。
而在強化單核性能的同時,V1平臺也支持強大的多核心擴展,最多可以做到96核心96線程,工藝上可以使用7nm、5nm,還支持DDR5內(nèi)存、PCIe 5.0總線、HBM2e高帶寬內(nèi)存、CCIX 1.1互連標準等。
ARM V1平臺仍然基于ARMv8.4-A CPU指令集,不過整體架構(gòu)、模塊組成和基于ARMv9指令集的非常類似,有諸多相通之處,同時也有全方位的微架構(gòu)改進,針對基準測試、服務器/高性能計算工作負載的全面增強,當然也不會不計代價地拉高功耗,同樣在電源、功耗、發(fā)熱管理方面做了強化。
相比于N1,作為Arm強調(diào)性能優(yōu)先的新型計算系列的第一個平臺,V1帶來了50%的性能提升、1.8倍的矢量工作負載優(yōu)化、4倍的機器學習工作負載優(yōu)化,可以靈活地為高度依賴CPU性能、帶寬的應用構(gòu)建強大的計算能力,SoC設計也非常靈活。
生態(tài)方面,法國芯片公司SiPearl、韓國電子通信研究所(ETRI),都在打造基于V1平臺的高性能SoC。
印度電子信息技術(shù)部(MeitY)夜間采納V1平臺,打造國家級百萬兆級高性能計算項目。
另外,ARM今天同步發(fā)布了Arm Neoverse CMN-700,這是業(yè)界最先進的Mesh網(wǎng)格互連技術(shù),能充分發(fā)揮V1、N2平臺的性能、能效優(yōu)勢。
在上一代CMN-600的基礎上,CMN-700在每個矢量上都進一步提升了性能,包括核心數(shù)量、緩存大小、附加內(nèi)存及IO設備的數(shù)量和類型等等。
另外,還記得嗎?月初的GTC大會上,NVIDIA宣布推出自研的ARM處理器Grace,這是一款面向數(shù)據(jù)中心的高性能處理器,性能會非常強大,將用于制造2千億億次超算“ALPS”(阿爾卑斯山)。
NVIDIA押注ARM處理器也是近年來的一個趨勢,ARM架構(gòu)已經(jīng)開始侵蝕高性能計算市場,跟x86搶地盤了,前不久ARM還推出了全新的ARMv9指令集架構(gòu),官方處理器Neoverse N2的單核性能提升40%,頻率提升10%,最多可以做到128核256線程。
ARM來勢洶洶,那AMD是否會重新進入ARM市場?畢竟前幾年AMD可是把ARM視為重點來抓的,還自研了K12 ARM處理器,可以兼容x86平臺。
在昨天的財報會議上,AMD CEO蘇資豐也回應了分析師有關ARM處理器的提問,她表示AMD對ARM很熟悉,同時把ARM公司視為重要合作伙伴,會在自己的產(chǎn)品上使用ARM IP核心。
不過蘇姿豐表示,如果說到特定的定制ARM產(chǎn)品,那AMD現(xiàn)在沒有。
如果是說AMD是否應該做半定制ARM設計,那答案也是肯定的,畢竟這就是半定制業(yè)務的意義。
蘇姿豐表示,這個問題不是ARM與x86的競爭,更多地是看在滿足客戶需求的過程中使用正確的IP核心,這就是我們看待ARM的立場。
蘇媽的回答非常官方,滴水不漏,簡單來說她的意思就是ARM之前嘗試過ARM處理器,但是現(xiàn)在不打算自己做ARM處理器了,畢竟自家的高性能Zen架構(gòu)在各個市場表現(xiàn)都很好。
當然,蘇媽也沒把話說死,暗示如果客戶有需求,那AMD也可以在半定制處理器上集成ARM的IP核心。
哦對了,NVIDIA對于ARM的收購,看起來非常麻煩,很懸。
在前不久的GTC 2021大會上,NVIDIA CEO黃仁勛還表示400億美元收購ARM一事進展良好,相信各國會放行這筆交易。
不過這幾天傳出了不太好的消息,英國政府也發(fā)出了公共利益干預通知(PIIN),確認會基于國家安全干預這筆交易。
英國方面現(xiàn)在只是表態(tài)會干預收購交易,尚無明確的同意或者拒絕,但是此舉已經(jīng)給NVIDIA收購ARM蒙上陰影。
英國方面提出干預是很正常的 ,ARM雖然在2016年就賣給了日本軟銀,但總部依然在英國倫敦,重要的研發(fā)中心、技術(shù)人才也都來自于英國,考慮到ARM CPU未來在移動、PC及數(shù)據(jù)中心市場的重要地位,英國不會輕易讓它被外國公司掌控。
NVIDIA原本預期在18個月內(nèi)完成收購,但是英國此番表態(tài)之后,花旗銀行的分析師們也在重新思考這件事,最新報告中指出這次的收購交易接近失敗,因為NVIDIA前不久推出了自己的數(shù)據(jù)中心處理器Grace,此后被各國批準的可能性只有10%了。
NVIDIA的Grace處理器細節(jié)還沒公布,但性能非常強大,又有先進的連接技術(shù)加持,配LPDDR5X內(nèi)存可提供超過500GB/s的帶寬,而且支持ECC錯誤校驗,通過緩存一致性NVLink總線連接自家GPU,帶寬可超過900GB/s,同時兩顆CPU之間的帶寬超過600GB/s。
當然,花旗這份報告并非單純唱衰NVIDIA,反而是認為在沒有ARM的情況下,NVIDIA會發(fā)展的更好,銷售自己的CPU產(chǎn)品要比授權(quán)IP更有錢賺。