[發明專利]共享本地存儲器分塊機制在審

申請號：	201810283460.8	申請日：	2018-04-02
公開（公告）號：	CN108694684A	公開（公告）日：	2018-10-23
發明（設計）人：	P·薩蒂;A·R·阿普;J·雷;S·M·馬余蘭;A·考克	申請（專利權）人：	英特爾公司
主分類號：	G06T1/20	分類號：	G06T1/20;G06T1/60
代理公司：	上海專利商標事務所有限公司 31100	代理人：	張欣;黃嵩泉
地址：	美國加利***	國省代碼：	美國;US
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	存儲器分塊存儲器地址處理線程分塊模式存儲共享應用訪問
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

公開了一種用于促進存儲器分塊的設備。所述設備包括：存儲器；一個或多個執行單元(EU)，用于經由對所述存儲器的訪問來執行多個處理線程；以及分塊邏輯，用于向所述存儲器中存儲的數據的存儲器地址應用分塊模式。

技術領域

本發明整體上涉及數據處理，并且更具體地涉及經由圖形處理單元進行的數據處理。

背景技術

當前的并行圖形數據處理包括開發用于對圖形數據執行諸如線性插值、曲面細分、柵格化、紋理映射、深度測試等特定操作的系統和方法。傳統上，圖形處理器使用固定功能計算單元來處理圖形數據。然而，最近，已使圖形處理器的各部分變成可編程的，使得這些處理器能夠支持更廣泛的操作來處理頂點和片段數據。

為了進一步提高性能，圖形處理器通常實現諸如流水線操作的處理技術，這些處理技術嘗試貫穿圖形流水線的不同部分并行地處理盡可能多的圖形數據。具有單指令多線程(SIMT)架構的并行圖形處理器被設計為使圖形流水線中的并行處理量最大化。在SIMT架構中，并行線程組嘗試盡可能經常地同步執行程序指令以提高處理效率。有關SIMT架構的軟件和硬件的一般概述可見于謝恩·庫克的《CUDA編程》第3章第37-51頁(2013年)(ShaneCook,CUDA Programming Chapter 3,pages 37-51(2013))。

圖形處理器通常實現共享本地存儲器(SLM)以在線程處理期間實現更高的性能和計算效率。當前，SLM由編譯器構建并用作高度分組(bank)存儲器，而不管基礎數據的訪問模式和維度如何。因此，當前的SLM設計使用地址空間到SLM庫的線性映射。

附圖說明

為了能夠詳細理解本發明的上述特征，通過參考實施例可以對上文簡述的本發明有更具體的說明，附圖中展示了這些實施例中的一些。然而應當指出的是，附圖僅僅展示了本發明的典型實施例，并且因此不應被認為是對本發明的范圍的限制，因為本發明可以允許其他等效的實施例。

圖1是展示了被配置成實現本文所述的實施例的一個或多個方面的計算機系統的框圖；

圖2A至圖2D展示了根據實施例的并行處理器部件；

圖3A至圖3B是根據實施例的圖形多處理器的框圖；

圖4A至圖4F展示了其中多個GPU通信地耦合至多個多核處理器的示例性架構；

圖5展示了根據實施例的圖形處理流水線；

圖6展示了根據實施例的SLM分塊(tiling)機制；

圖7展示了常規的SLM配置；

圖8展示了根據實施例的由SLM分塊機制實現的SLM配置；

圖9是根據實施例的處理系統的框圖；