對(duì)于當(dāng)前的智能手機(jī),SoC的重要性不言而喻。作為當(dāng)前安卓陣營中最先進(jìn)的平臺(tái),驍龍835在目前已經(jīng)推出的旗艦機(jī)上有著:快且不熱的優(yōu)秀體驗(yàn)。從許多媒體的評(píng)價(jià)來看,驍龍835平臺(tái)可以稱得上近幾年綜合體驗(yàn)最為出色的一款處理器。因此,我們本期的機(jī)情觀察室,就來看看驍龍835的深度性能究竟處于怎樣的水平。
在驍龍835之前,驍龍?zhí)幚砥鞫急环Q為SoC(系統(tǒng)級(jí)芯片),而到了這一代則改名為“Platform”(平臺(tái)),其用意在于高通對(duì)于移動(dòng)計(jì)算平臺(tái)的整個(gè)布局,而非單獨(dú)的CPU、GPU等電器元件。驍龍835采用三星10nm FinFETLPE工藝,當(dāng)前半導(dǎo)體工藝能達(dá)到量產(chǎn)的最高水準(zhǔn),不過此次采用的是LPE工藝,不排除高通會(huì)在后續(xù)升級(jí)一個(gè)LPP工藝的版本,類似驍龍820/821一樣。另外,根據(jù)高通官方的說法,驍龍835上采用30億顆晶體管,逼近iPhone7上采用的A10 Fusion 33億的數(shù)量,這也是高通處理器距離iPhone自主設(shè)計(jì)的A系列最近的一次。因此也帶來了良好的使用體驗(yàn)。
通過這個(gè)表格,我們可以看到驍龍835采用Kryo280架構(gòu),八核心設(shè)計(jì),最高主頻為2.45GHz,小核為1.9GHz,GPU為Adreno 540,主頻為710GHz,整個(gè)芯片封裝尺寸減小35%。而根據(jù)高通公司的數(shù)據(jù),驍龍835功耗降低了25%(比驍龍801降低了50%)。此外,在驍龍835平臺(tái)中,還集成了雙14位Spectra 180 ISP、Hexagon 690 DSP、X16 Modem??梢钥吹剑啾扔谄渌业腟oC,高通在SoC上覆蓋到更多的計(jì)算區(qū)域,將處理器打造成智能手機(jī)的全面管家,通過“人無我有、人有我優(yōu)”的概念,全面進(jìn)駐到各區(qū)域。在筆者看來,這也是高通在這一代將移動(dòng)處理器改名為“平臺(tái)”的原因。
CPU性能測試:
在驍龍820上,高通首次打造出64位自研的Kryo架構(gòu),其獨(dú)特的架構(gòu)對(duì)于浮點(diǎn)IPC的運(yùn)算有著非常不錯(cuò)的性能,但在整數(shù)IPC的運(yùn)算方面則還不如ARM官方的A57架構(gòu),并且在功耗方面也并不夠優(yōu)秀。因此高通在驍龍835上采用全新的Kryo 280架構(gòu),盡管同名為Kryo,但此“Kryo非彼Kryo”,Kryo280并非常規(guī)升級(jí)的產(chǎn)物,而是采用全新架構(gòu)。
簡單來說,Kryo280采用八核心類似BigLittle架構(gòu),采用四顆性能大核+四顆效率小核,不過Kryo280最具特色的,還是其成為第一個(gè)采用ARM新架構(gòu)之上重新設(shè)計(jì)的架構(gòu),“Built on ARM Cortex Technology”這項(xiàng)技術(shù)允許供應(yīng)商重新根據(jù)自己的需求修改公版架構(gòu),比如廠商可以應(yīng)自己需求去定制指令窗口大小以增加IPC,但類似解碼器寬度或者是執(zhí)行管道這種則超出了修改范圍。這種半定制設(shè)計(jì)可以使得廠商能夠?qū)⒆约旱漠a(chǎn)品與ARM公版區(qū)別開來,同時(shí)也可以省去重新開發(fā)的架構(gòu)所需的時(shí)間和費(fèi)用。盡管我們并不知道高通的Kryo280是基于哪個(gè)公版進(jìn)行的修改,但兩個(gè)CPU集群確實(shí)都是采用了半定制設(shè)計(jì)。并且高通宣稱,其內(nèi)存控制器也是自己設(shè)計(jì)的。
在GeekBench4的單線程整數(shù)跑分測試中,可以看到驍龍835相比前代的821基本上是六四開的贏面。盡管在整數(shù)IPC方面有所長進(jìn),但在Canny(邊緣檢測)、JPGE、PDF渲染方面均輸給了821,有趣的是,在之前我們麒麟960的性能測試中,也是這幾項(xiàng)輸給了驍龍821,而這些整數(shù)測試的成績大多依靠L1、L2緩存,因此ANANDTECH推測,可能Kryo280就是基于ARM A73公版半定制化。另外,驍龍835在GeekBench4其它子項(xiàng)目的成績都與麒麟960比較接近,這也并非是主頻或測試方法可以干預(yù)的。因此說明,即便通過BoC修改的半定制架構(gòu),可修改的幅度也比較有限。
而在GeekBench4單線程整數(shù)運(yùn)算(加入頻率)測試中,用上表整體整數(shù)除以頻率,可以更直接的比較不同架構(gòu)間的IPC。可以看到,Kryo280與A73架構(gòu)成績還是比較接近,其整數(shù)IPC比A72高出6%,比A57高出14%,不過與驍龍821相比,則高出22%。
而在浮點(diǎn)運(yùn)算中,令我們非常意外的是Kryo280的竟然全面落后驍龍821。按筆者的猜測,Kryo的浮點(diǎn)運(yùn)算一直是其強(qiáng)項(xiàng),而到了Kryo280,并沒有采用全自主設(shè)計(jì),而BoC可改動(dòng)的幅度又小,因此才出現(xiàn)了這種情況。不過可以看到,Kryo280與麒麟960的A73成績比較相當(dāng)。
在之前麒麟960測試A73時(shí),考慮到A73的NEON執(zhí)行單元與A72相比并沒有改變,而降低了特殊指令的延遲,當(dāng)時(shí)猜測有些測試項(xiàng)目受到A73解碼器寬度的變化。因此,麒麟960的A73與驍龍835的Kryo280都顯示出了相比A72減少了L2緩存的讀/寫帶寬(以及較低的L1寫入帶寬),這也可能對(duì)性能造成影響。
而將頻率計(jì)算進(jìn)去,Kryo280則悲劇的敗給驍龍821 23%,不知道高通究竟是因?yàn)橥讌f(xié)的結(jié)果還是自己設(shè)計(jì)思路上的改變。兩年前高通在研發(fā)Kryo時(shí),就考慮到未來的新工作所需的變化,因此將更多的工作由GPU或DSP來提高效率,因此也可以接受犧牲一些浮點(diǎn)運(yùn)算來節(jié)省面積或功耗。
內(nèi)存測試方面,Kryo280、A73、A72和A57內(nèi)核都有2個(gè)地址生成單元(AGU),但A72和A57可以使用專門的AGU進(jìn)行加載和儲(chǔ)存操作,Kryo280和A73的每個(gè)AGU都進(jìn)行加載和儲(chǔ)存同時(shí)進(jìn)行。因此,對(duì)于A73架構(gòu),這樣的策略相當(dāng)于減少了內(nèi)存延遲,并且增加內(nèi)存帶寬。
而對(duì)于Kryo280來說,相比麒麟960還甚至增加了11%,對(duì)比驍龍821和810都有所增加。但并沒有A72到A73升級(jí)幅度大,因?yàn)樵隍旪?21的Kryo中,就已經(jīng)可以做到單個(gè)AGU同時(shí)進(jìn)行加載和儲(chǔ)存,只不過之前的內(nèi)存延遲更高而已。
系統(tǒng)性能測試:
▲總分
直到目前,我們可以初步認(rèn)為驍龍835的Kryo280相當(dāng)于一個(gè)BigLittle組合的半定制A53+A73 CPU內(nèi)核,其整數(shù)與浮點(diǎn)運(yùn)算都接近于麒麟960.而像PCMark這樣系統(tǒng)級(jí)的測試,其中就包括了調(diào)用安卓標(biāo)準(zhǔn)的API接口來強(qiáng)調(diào)CPU、GPU、RAM以及NAND儲(chǔ)存的實(shí)際工作負(fù)載。但我們都知道,手機(jī)系統(tǒng)的體驗(yàn)不僅僅取決于硬件性能,還取決于廠家對(duì)其系統(tǒng)的優(yōu)化,包括程序的優(yōu)先級(jí)以及動(dòng)態(tài)電壓頻率調(diào)整的策略,以控制手機(jī)的發(fā)熱等問題。不過這并不妨礙我們看到驍龍835的原型測試機(jī)在PCMark排名第一,超越了Mate9的麒麟960,并且比驍龍821還領(lǐng)先了23%。
▲網(wǎng)頁測試
網(wǎng)頁測試,驍龍835的原型機(jī)表現(xiàn)良好,超過Mate9 10%,并且超過驍龍821 34%。不過尷尬的是采用驍龍820/821的機(jī)器全部落后于麒麟960、麒麟950,看起來還是有些悲劇。
▲寫入測試
在寫入操作時(shí)(包括對(duì)PDF文件的處理和加密),內(nèi)存測試以及將文件讀取和寫入閃存時(shí),會(huì)在CPU的大核上有所要求。因此這個(gè)測試會(huì)產(chǎn)生一些多變的結(jié)果。比如樂Pro3會(huì)比S7 Edge快40%,而驍龍835則與Mate9之間差異很小,不過對(duì)比驍龍821的產(chǎn)品,還是體現(xiàn)出吊打級(jí)的優(yōu)勢。
▲數(shù)據(jù)操作
數(shù)據(jù)操作測試中,主要測試的是整數(shù)工作負(fù)載,用于測量從多種不同文件類型中分析數(shù)據(jù)所需的時(shí)間,然后與動(dòng)圖表交互記錄幀率。驍龍835的原型機(jī)與Mate9在此相差無幾,不過也是唯二沖上5000分的,對(duì)其它821的機(jī)器又是一頓吊打。。。
▲視頻編輯測試
視頻編輯測試:采用OpenGL ES 2.0著色器提供視頻效果進(jìn)行視頻編輯測試,對(duì)系統(tǒng)來說屬于比較輕量級(jí)的測試。在測試中,我們發(fā)現(xiàn)GPU基本處于空閑狀態(tài),大多數(shù)情況下都由CPU的小核心完成。因此可以看到,基本上每款產(chǎn)品的成績都差不多。
▲照片編輯測試
照片編輯測試則是采用多種照片的效果和濾鏡來測試CPU和GPU,由于Adreno GPU上強(qiáng)大的ALU性能,驍龍835和驍龍820/821則位居前列。Adreno 540又一次吊打了Mali T系列和G71。
在Kraken 1.1測試中(使用Chrome、Safari、IE),iPhone表現(xiàn)最好,不過這也并不足以證明蘋果A系列芯片與安卓其它SoC之間的差異,因?yàn)樗鼈兎謩e采用不同的瀏覽器。而iPhone性能優(yōu)勢很大一部分來自Safari的JavaScrip引擎。
而驍龍835的原型機(jī)與其它使用Chrome的手機(jī)相比,在Kraken測試中與驍龍821的產(chǎn)品并沒有太大差別,在JetSteam中與Mate9相近,而在WebXPRT 2015測試中,則大幅度領(lǐng)先驍龍820/821的產(chǎn)品。
GPU性能測試:
GPU方面,此次驍龍835采用Adreno 540,與之前驍龍821的Adreno 530架構(gòu)基本相同,并且對(duì)ALU以及文件寄存器進(jìn)行了一些優(yōu)化,并且通過改進(jìn)深度過濾器來減少每個(gè)像素的工作量,進(jìn)一步提高性能和降低功耗。為此,高通官方宣稱Adreno 540的3D渲染相比530提高25%,GPU的主頻峰值也達(dá)到710MHz,相比Adreno 530提升了14%。
GFXBench的霸王龍測試是一款基于OpenGL ES 2.0的游戲模擬測試,我們看到驍龍835的原型機(jī)與iPhone7 Plus、Mate9都達(dá)到60幀的成績,不過Mate9與iPhone7 Plus都為1080P屏幕,而驍龍835的原型機(jī)則是第一款達(dá)到這樣成績的2K分辨率的產(chǎn)品。
而在離屏(固定以1080P分辨率渲染)測試中,驍龍835的性能則超過了iPhone7 Plus與Mate 9,甚至比驍龍820提升了25%,與高通官方宣稱的一致。
在GFXBench的高性能Car chase測試模擬了現(xiàn)代渲染管道,其中包含OpenGL ES 3.1以及安卓擴(kuò)展包,主要是考驗(yàn)ALU性能。在這一測試中,驍龍835吃了分辨率的虧,成績落后于一加3T以及Mate9。而當(dāng)離屏狀態(tài)下,則重回第一。一般來說,廠商的PPT多少都有些夸大的意味,而在GPU部分,高通則確實(shí)做到了他們PPT中所承諾的提升,甚至在離屏測試中比Mate9的Mali G71 mp8還要強(qiáng)大。而Mali G71則是基于ARM最新的Bifrost架構(gòu),主頻甚至到了960MHz至1037MHz。
在3DMark中Sling Shot Extreme測試中,采用安卓上的OpenGL ES 3.1或iOS上的Metal,通過2K分辨率來進(jìn)行渲染來強(qiáng)調(diào)GPU和內(nèi)存的性能。在于A10、Exynos 8890,麒麟960以及驍龍820,幾乎當(dāng)前所有頂尖處理器在一起評(píng)比,因此驍龍835在總分測試中排名第一、圖形測試中iPhone 7 Plus高10%,比820和8890版的S7高了24%,這樣的成績還是非常有意義的。
在第二個(gè)測試中強(qiáng)調(diào)了GPU著色器的性能,因此我們可以看到Adreno 540有了明顯的提升,相比Adreno 530的S7提升34%,超過了Mate 9的G71 50%,高通在ALU以及文件寄存器上的提升看到了效果。物理測試主要是在CPU上運(yùn)行,并且受SoC內(nèi)存管理器隨機(jī)訪問的嚴(yán)重影響,因此盡管CPU表現(xiàn)接近,但驍龍835還是比Mate9快了14%。而或許是由于驍龍835的內(nèi)存管理比麒麟960的內(nèi)存延遲更低而帶寬更寬。
Basemark ES 3.1測試模擬了安卓OpenGL ES 3.1和iOS上的Metal,包括了許多后期處理、粒子和照明效果,但不像GFXBench 4.0 Car Chase測試中的計(jì)算。
在Vulkan被加入到基準(zhǔn)測試中之前,安卓設(shè)備大多依賴OpenGL,使得對(duì)比運(yùn)行Metal的圖形API的iPhone處于很大的劣勢。使得驍龍835比iPhone7 Plus落后73%。而在Basemark ES 3.1測試中,ARM的Mali GPU居然超過了Adreno,Exynos 8890的Mali-T880 MP12比驍龍820的Adreno 530快15%,而麒麟960的Mali-G71MP8在屏幕測試中比S835的Adreno 540快25%。而驍龍835則比Pixel XL提升了40%。
所有的游戲模擬測試,都展現(xiàn)出Adreno 540優(yōu)秀的ALU性能。因此我們測試驍龍835在GFXBench中合成的ALU測試,不過奇怪的是提升的微架構(gòu)相比820并沒有多少用。在表格中,驍龍835相比于驍龍820/821的提升都與主頻對(duì)應(yīng)。
功耗測試:
功耗方面,通過測試驍龍820以及驍龍835兩款原型機(jī),驍龍820的平均功耗為4.6W,而驍龍835則降至3.56W,功耗降低了23%。不過在實(shí)際使用中,不同用戶有不同的使用場景,因此這個(gè)結(jié)論暫時(shí)也只能當(dāng)做參考。
總結(jié):
如今的手機(jī)SoC包含了CPU、GPU、高性能DSP、低功率DSP、ISP、Modem、固定功能模塊(音頻、視頻解碼),在這么多電器元件中,CPU,GPU和內(nèi)存性能這些都很容易測試。但能導(dǎo)致SoC設(shè)計(jì)中有較大差異的部分,比如DSP,ISP和其他方面的測試則并不容易,而恰好,這些則是高通的強(qiáng)項(xiàng)。
在測試中,我們猜測驍龍835的Kryo280架構(gòu)可以看成一個(gè)A53+A73的半定制架構(gòu),Kryo280的大核的整數(shù)與浮點(diǎn)IPC與麒麟960中的A73非常接近,而與驍龍821相比之下,整數(shù)運(yùn)算有了明顯提升,浮點(diǎn)運(yùn)算則全面落后,但總體來說,進(jìn)步大于落后。在測試中,毫無疑問,相比驍龍821,驍龍835有著更好的體驗(yàn)。盡管測試數(shù)據(jù)都是基于高通原型機(jī),而在筆者實(shí)際體驗(yàn)量產(chǎn)版的驍龍835(小米6)一段時(shí)間后,感覺高通驍龍835確實(shí)有著不錯(cuò)的使用體驗(yàn):穩(wěn)定流暢且不熱。而給筆者最大的感覺則是相比于驍龍820,驍龍835幾乎能有“看得見般”體驗(yàn)的提升。對(duì)于當(dāng)前性能逐漸“擠牙膏”的智能手機(jī),此次驍龍835確實(shí)表現(xiàn)非常不錯(cuò)。