[發明專利]共享本地存儲器分塊機制在審
| 申請號: | 201810283460.8 | 申請日: | 2018-04-02 |
| 公開(公告)號: | CN108694684A | 公開(公告)日: | 2018-10-23 |
| 發明(設計)人: | P·薩蒂;A·R·阿普;J·雷;S·M·馬余蘭;A·考克 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20;G06T1/60 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 張欣;黃嵩泉 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 存儲器 分塊 存儲器地址 處理線程 分塊模式 存儲 共享 應用 訪問 | ||
公開了一種用于促進存儲器分塊的設備。所述設備包括:存儲器;一個或多個執行單元(EU),用于經由對所述存儲器的訪問來執行多個處理線程;以及分塊邏輯,用于向所述存儲器中存儲的數據的存儲器地址應用分塊模式。
技術領域
本發明整體上涉及數據處理,并且更具體地涉及經由圖形處理單元進行的數據處理。
背景技術
當前的并行圖形數據處理包括開發用于對圖形數據執行諸如線性插值、曲面細分、柵格化、紋理映射、深度測試等特定操作的系統和方法。傳統上,圖形處理器使用固定功能計算單元來處理圖形數據。然而,最近,已使圖形處理器的各部分變成可編程的,使得這些處理器能夠支持更廣泛的操作來處理頂點和片段數據。
為了進一步提高性能,圖形處理器通常實現諸如流水線操作的處理技術,這些處理技術嘗試貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數據。具有單指令多線程(SIMT)架構的并行圖形處理器被設計為使圖形流水線中的并行處理量最大化。在SIMT架構中,并行線程組嘗試盡可能經常地同步執行程序指令以提高處理效率。有關SIMT架構的軟件和硬件的一般概述可見于謝恩·庫克的《CUDA編程》第3章第37-51頁(2013年)(ShaneCook,CUDA Programming Chapter 3,pages 37-51(2013))。
圖形處理器通常實現共享本地存儲器(SLM)以在線程處理期間實現更高的性能和計算效率。當前,SLM由編譯器構建并用作高度分組(bank)存儲器,而不管基礎數據的訪問模式和維度如何。因此,當前的SLM設計使用地址空間到SLM庫的線性映射。
附圖說明
為了能夠詳細理解本發明的上述特征,通過參考實施例可以對上文簡述的本發明有更具體的說明,附圖中展示了這些實施例中的一些。然而應當指出的是,附圖僅僅展示了本發明的典型實施例,并且因此不應被認為是對本發明的范圍的限制,因為本發明可以允許其他等效的實施例。
圖1是展示了被配置成實現本文所述的實施例的一個或多個方面的計算機系統的框圖;
圖2A至圖2D展示了根據實施例的并行處理器部件;
圖3A至圖3B是根據實施例的圖形多處理器的框圖;
圖4A至圖4F展示了其中多個GPU通信地耦合至多個多核處理器的示例性架構;
圖5展示了根據實施例的圖形處理流水線;
圖6展示了根據實施例的SLM分塊(tiling)機制;
圖7展示了常規的SLM配置;
圖8展示了根據實施例的由SLM分塊機制實現的SLM配置;
圖9是根據實施例的處理系統的框圖;
圖10是根據實施例的處理器的框圖;
圖11是根據實施例的圖形處理器的框圖;
圖12是根據一些實施例的圖形處理器的圖形處理引擎的框圖;
圖13是由附加實施例提供的圖形處理器的框圖;
圖14展示了線程執行邏輯,所述線程執行邏輯包括在一些實施例中采用的處理元件陣列;
圖15是展示了根據一些實施例的圖形處理器指令格式的框圖;
圖16是根據另一個實施例的圖形處理器的框圖;
圖17A至圖17B展示了根據一些實施例的圖形處理器命令格式和命令序列;
圖18展示了根據一些實施例的數據處理系統的示例性圖形軟件架構;
圖19是展示了根據實施例的IP核開發系統的框圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810283460.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:寫出級生成的包圍盒
- 下一篇:改進的圖形處理器微架構內的多分辨率圖像平面渲染





