[發明專利]對共享本地存儲器進行分區的機制在審
| 申請號: | 202011010193.0 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN113094298A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | J·雷;V·蘭加納坦;B·阿什博;J·瓦樂瑞奧 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06F12/084 | 分類號: | G06F12/084;G06F12/0897;G06F12/1027;G06T1/20 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 劉文燦 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 共享 本地 存儲器 進行 分區 機制 | ||
公開了一種用于促進對本地存儲器的分區的裝置。該裝置包括:多個執行單元,用于執行多個執行線程;存儲器,其被耦合以在多個執行單元之間共享訪問;以及分區硬件,用于對要用作高速緩存和共享本地存儲器(SLM)的存儲器進行分區;其中,分區硬件基于在活動的執行單元上執行的多個執行線程的數量來對存儲器進行分區。
版權聲明
本專利文件的公開內容的一部分包含受版權保護的材料。版權所有者不反對任何人以專利和商標局專利文件或記錄中出現的方式對專利文件或專利公開內容進行傳真復制,但保留所有版權。
背景技術
圖形處理單元(GPU)是高線程化機器,其中并行執行一個程序的數百個線程以實現高吞吐量。GPU線程組在網格著色應用程序中實現,以執行三維(3D)渲染。隨著越來越復雜的GPU要求繁重的計算,要滿足存儲器帶寬要求是一個挑戰。
附圖說明
為了可以詳細地理解本發明的上述特征的方式,可以通過參考實施例來具有對上面簡要總結的本發明的更具體的描述,其中一些實施例在附圖中示出。然而,應當注意,附圖僅示出了本發明的典型實施例,因此不應視為對本發明范圍的限制,因為本發明可以允許其他等效實施例。
圖1是根據一個實施例的處理系統的框圖;
圖2A-2D示出了由本文描述的實施例提供的計算系統和圖形處理器;
圖3A-3C示出了由實施例提供的附加圖形處理器和計算加速器架構的框圖;
圖4是根據一些實施例的圖形處理器的圖形處理引擎的框圖;
圖5A-5B示出了根據實施例的線程執行邏輯500,其包括在圖形處理器核中采用的處理元件的陣列;
圖6示出了根據一個實施例的附加執行單元600;
圖7是說明根據一些實施例的圖形處理器指令格式的框圖;
圖8是根據另一實施例的圖形處理器的框圖;
圖9A和9B示出了根據一些實施例的圖形處理器命令格式和命令序列;
圖10示出了根據一些實施例的用于數據處理系統的示例性圖形軟件架構;
圖11A-11D示出了根據一個實施例的集成電路封裝組裝件;
圖12是示出根據實施例的示例性片上系統集成電路的框圖;
圖13A和13B是示出了另一示例性圖形處理器的框圖;
圖14示出了計算設備的一個實施例;
圖15示出了子切片的一個實施例;
圖16示出了線程產生器邏輯的一個實施例;
圖17A和17B示出了SLM分配的實施例;
圖18是示出用于對共享本地存儲器進行分區的過程的一個實施例的流程圖;并且
圖19示出了用于對共享本地存儲器進行分區的偽代碼的一個實施例。
具體實施方式
在下面的描述中,闡述了許多具體細節以提供對本發明的更透徹的理解。然而,對于本領域的技術人員將顯而易見的是,可在沒有這些具體細節中的一個或多個的情況下實踐本發明。在其他情況下,沒有描述眾所周知的特征,以避免使本發明晦澀難懂。
在實施例中,共享本地存儲器(SLM)可以被實現為在這樣的實施例中用作高速緩存以及SLM,可以基于在活動的執行單元上執行的多個執行線程的數量來對SLM進行分配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011010193.0/2.html,轉載請聲明來源鉆瓜專利網。





