Metal - GPU - GPU功能

查找特定GPU系列的功能列表

金屬特征集

  • 使用金屬特征集表

使用metal 軟件版本和GPU系列查找功能可用性。

概述

metal 中功能的可用性取決于metal軟件版本和GPU支持的系列功能集。metal feature set tables 提供了跨不同gpu系列的功能可用性。某些數(shù)值限制和像素格式支持。

  1. 要查看Numbers電子表格中的表格,請參閱讀功能集(Numbers)。

  2. 要查看PDF格式的表格,請參閱功能集(PDF)。

蘋果GPU系列

  • 了解GPU系列4

了解有關A11功能的信息。包括柵格順序組,圖塊著色器和圖像塊。

概述

GPU系列4描述了A11芯片以其Apple設計的圖形處理單元(GPU)架構所實現(xiàn)的新功能和性能增強。

ios 和 tvos 設備中的GPU實現(xiàn)了一種稱為基于圖片的延遲渲染(TBDR)的渲染技術,以優(yōu)化性能和功效。在傳統(tǒng)的即時模式(IM)渲染器中,將三角形提供給GPU進行處理時,會立即將其渲染到設備內(nèi)存中,即使三角形被后來提供給GPU的其他圖元所遮擋,三角形也會由柵格化和片段功能階段處理。

基礎圖塊的延遲渲染

TBDR對IM體系結(jié)構進行了一些重大更改,在所有原語都提交后對場景進行處理。屏幕被拆分為單獨處理的圖塊。同時處理與圖塊相交的所有幾何圖形。并且在光柵化和片段著色階段之前,將遮擋的片段丟棄。切片會渲染到GPU上的快速本地內(nèi)存中,并且僅在渲染完成后才寫出到設備內(nèi)存中。

TBDR 允許頂點和片段階段異步運行與IM相比,性能得到了顯住改善,在運行渲染過程的片段時,硬件會并行執(zhí)行未來渲染過程的頂點階段。頂點階段通常大量使用固定功能硬件,而片段階段通常使用數(shù)字和帶寬。完全重疊可以使設備同時使用gpu上的所有硬件模塊。

TBDR 使用的切片存儲器具有三個重要特征。首先,著色器核心和切片內(nèi)存之間的帶寬比GPU和設備內(nèi)存之間的帶寬高很多倍。并且與著色器核心的數(shù)量成正比例的擴展,其次,對圖塊內(nèi)存的內(nèi)存訪問延遲比對設備內(nèi)存的延遲低很多倍,最后,平鋪內(nèi)存比設備內(nèi)存消耗的功率少得多。

在基于A7到A10的設備上,metal 沒有明確描述這種基于圖塊的體系結(jié)構,而是使用它為基礎實現(xiàn)提供提示。例如,加載和存儲操作控制將哪些數(shù)據(jù)加載到本地內(nèi)存中以及將哪些數(shù)據(jù)寫出設備內(nèi)存中。同樣,無內(nèi)存緩沖區(qū)指定僅在渲染過程中使用的每個像素的中間數(shù)據(jù)。實際上,此數(shù)據(jù)存儲在GPU的快速本地內(nèi)存中的圖塊中。

A11 GPU上的metal 2

蘋果公司在A11設計的GPU提供了多項功能,可顯著增強TBDR。這些功能是通過其他Metal2 API提供的,可讓您的應用和游戲?qū)崿F(xiàn)更高水平的性能和功能。

這些功能包括圖像,圖塊底紋,柵格順序組和圖像塊樣本覆蓋率控制。A11 GPU上的Metal 2還提高了碎片丟棄性能。

從廣義上講,這些功能可以更好的控制內(nèi)存布局和對圖塊中存儲的數(shù)據(jù)的訪問,從提供更細粒度的同步,以使GPU上的工作更多,最終結(jié)果是,您可以在一次渲染過程中執(zhí)行比以往更多的計算,并將這些計算保留在快速的本地內(nèi)存中。

A11 上的Metal2 還簡化了諸如地下映射,與順序無關的透明度基于圖塊的照明算法之類的技術的實現(xiàn)。

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容