[發明專利]管芯上曲面細分分配在審
| 申請號: | 201780046878.0 | 申請日: | 2017-08-02 |
| 公開(公告)號: | CN109564676A | 公開(公告)日: | 2019-04-02 |
| 發明(設計)人: | P·L·多伊爾 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20;G06T1/60 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 高見;黃嵩泉 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 重新分配 緩沖器 片外存儲器 圖形處理器 功率損失 大型管 上曲面 管芯 分配 訪問 | ||
可使用本地曲面細分工作重新分配來增加圖形處理器的曲面細分處理速率。重新分配機制可避免對大型管芯上緩沖器的需要,并且由于分配是本地的,因此在一些實施例中還可以避免使用片外存儲器訪問引起的性能和功率損失。
背景技術
在圖形處理單元(GPU)中提供競爭幾何處理性能通常涉及多個并行、并發的幾何處理固定功能流水線(GPP)。這些GPP(有時也稱為SMM、幾何和設置固定功能流水線、或預曲面細分(tessellation)和后曲面細分流水線)包括OpenGL渲染流水線(RP)中的可編程著色器與固定功能級的混合。請參閱開放圖形語言規范(“OpenGL”),請參閱Open GL規范4.2。曲面細分包括補塊(patch)圖元(primitive)(也稱為“對象”),以及計算其頂點的頂點值。曲面細分控制著色器可通過指定曲面細分因子來確定要進行多少曲面細分。可在應用級定義每個補塊的頂點數量。補塊對象可以是三角形或四邊形(其為正方形)。
曲面細分涉及將與輸入補塊圖元相關聯的參數域細分為三角形圖元集并計算經曲面細分域的點(與那些三角形圖元的角一致)處的頂點值。輸入補塊圖元可與三角形或四邊形參數域相關聯。曲面細分控制著色器可通過指定針對每個補塊的曲面細分因子集來確定將域細分為三角形的精細程度。曲面細分評估著色器可隨后使用與輸入補塊圖元相關聯的輸入控制點集以及經曲面細分域點處的域參數來計算頂點值。可在應用級定義與補塊圖元相關聯的輸入控制點的數量。
并行渲染圖形架構的典型問題是如何在維持嚴格的有序三維(3D)流水線渲染模型的同時利用并行GPP以及渲染或光柵化流水線(RP)。涉及的主要問題是渲染過程期間應用供給的“對象空間”幾何圖元向經渲染圖像上的任意映射,其中“排序-中間(Sort-Middle)”架構已被業界有效地利用。在此方案中,GPU首先經由并行GPP對對象空間圖元的任意分布的子集(“批次”)執行完全幾何處理。然后,所得屏幕空間圖元隨后被恰當地重新排序(即,在時間上排序),并基于每個RP擁有的屏幕空間區域而經由光柵化交叉開關被分配給RP。
在設計中增加GPP的數量(N)將典型地需要每個GPP的輸出處的更深的緩沖器,以便在GPP“等待輪到它”向光柵化交叉開關輸出時提供足夠的GPP輸出緩沖。此處,GPP輸出緩沖器的大小很可能會被調整為其他(N-1)GPP將其批次排出到交叉開關所花費的平均時間。如果沒有提供足夠的緩沖,則整體幾何吞吐量趨向于降低到單個GPP的吞吐量,因為“等待輪到它們”的GPP將很快停止,因為它們在等待時不會被排出,并且當輪到它們時,它們將以GPP處理速率(比交叉開關速率慢)向交叉開關輸出。
附圖說明
參照以下附圖描述一些實施例:
圖1是根據一個實施例的管芯上曲面細分的架構描繪;
圖2是根據一個實施例的TEFE與TEBE之間的流的更詳細描繪;
圖3是針對一個實施例的TEFE流程圖;
圖4是針對一個實施例的DPM生成器流程圖;
圖5A和5B是根據一個實施例的針對TEBE的流程圖;
圖6是根據一個實施例的處理系統的框圖;
圖7是根據一個實施例的處理器的框圖;
圖8是根據一個實施例的圖形處理器的框圖;
圖9是根據一個實施例的圖形處理引擎的框圖;
圖10是圖形處理器的另一實施例的框圖;
圖11是根據一個實施例的線程執行邏輯的描繪;
圖12是根據一些實施例的圖形處理器指令格式的框圖;
圖13是圖形處理器的另一實施例的框圖;
圖14A是根據一些實施例的圖形處理器命令格式的框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780046878.0/2.html,轉載請聲明來源鉆瓜專利網。





