[發(fā)明專利]用于經(jīng)由紋理硬件實(shí)施存儲器訪問操作的技術(shù)無效
| 申請?zhí)枺?/td> | 201310704648.2 | 申請日: | 2013-12-19 |
| 公開(公告)號: | CN103885902A | 公開(公告)日: | 2014-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 布雷恩·法斯;埃里克·T·安德森;尼克·巴羅威廉姆斯;瑟利斯·加德雷;喬爾·詹姆斯·麥科馬克;布里翁·S·諾德奎斯特;尼馬爾·拉伊·薩克塞納;蘭基·V·姍 | 申請(專利權(quán))人: | 輝達(dá)公司 |
| 主分類號: | G06F13/16 | 分類號: | G06F13/16 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 董巍;謝栒 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 經(jīng)由 紋理 硬件 實(shí)施 存儲器 訪問 操作 技術(shù) | ||
技術(shù)領(lǐng)域
本發(fā)明總地涉及存儲器訪問操作,并且更具體地,涉及用于經(jīng)由紋理硬件實(shí)施存儲器訪問操作的技術(shù)。
背景技術(shù)
常規(guī)的圖形處理單元(GPU)包括紋理處理硬件,其配置為實(shí)施各種與紋理相關(guān)的操作,包括紋理加載操作和紋理高速緩存操作。圖形程序開發(fā)者可生成使用這種紋理處理硬件的著色器程序以渲染三維圖形場景。
近年來,程序開發(fā)者們已經(jīng)開始生成實(shí)施任意的、非面向圖形的操作的著色器程序,所述操作利用(leverage)GPU的并行處理架構(gòu)的杠桿。然而,考慮到紋理處理硬件的架構(gòu),那些存儲器訪問操作必須被仔細(xì)地設(shè)計(jì)以類似于紋理處理操作。例如,典型的紋理訪問操作基于與紋理相關(guān)聯(lián)的二維(2D)坐標(biāo)和維度從存儲器讀取2D紋理數(shù)據(jù)。為了生成能夠加載非紋理數(shù)據(jù)的著色器程序,程序開發(fā)者必須將所有數(shù)據(jù)元素明確地聲明為具有體現(xiàn)與紋理相似的2D數(shù)據(jù)結(jié)構(gòu)的2D坐標(biāo)和維度,而不管與該數(shù)據(jù)相關(guān)聯(lián)的實(shí)際維度。
上述方法是有問題的,因?yàn)閯?chuàng)建實(shí)施任意計(jì)算的著色器程序要求大量的紋理處理操作知識,而許多希望利用GPU的并行處理架構(gòu)的程序開發(fā)者缺乏這類知識。這些要求為許多程序開發(fā)者造成了相當(dāng)大的進(jìn)入障礙。
該問題的一個解決方案是除了現(xiàn)存的紋理處理硬件之外,還為通用存儲器訪問操作創(chuàng)建單獨(dú)的數(shù)據(jù)路徑。采用該方法,希望采用任意的非紋理數(shù)據(jù)來實(shí)施處理操作的程序開發(fā)者可簡單地寫出依靠該單獨(dú)路徑的程序。然而,該方法是有問題的,因?yàn)槌R?guī)的GPU就是缺乏集成附加數(shù)據(jù)路徑所要求的空間,并且增加GPU的大小代價很高。
因此,本領(lǐng)域需要的是用于經(jīng)由紋理處理硬件來實(shí)施通用數(shù)據(jù)訪問操作的更有效的技術(shù)。
發(fā)明內(nèi)容
一種用于實(shí)施數(shù)據(jù)訪問操作的計(jì)算機(jī)實(shí)現(xiàn)的方法,包括:接收來自線程組內(nèi)的線程的存儲器訪問請求,確定與存儲器訪問請求相關(guān)聯(lián)的數(shù)據(jù)部分未存在于高速緩存存儲器單元中,從全局存儲器中檢索與存儲器訪問請求相關(guān)聯(lián)的數(shù)據(jù)部分,在線程組內(nèi)的線程的執(zhí)行期間將數(shù)據(jù)部分存儲在高速緩存存儲器單元內(nèi),以及一旦確定線程組內(nèi)的每個線程均已在處理單元上完成執(zhí)行則將數(shù)據(jù)部分從高速緩存存儲器單元中清除(flush)。
所公開的技術(shù)的一個優(yōu)點(diǎn)是,紋理處理硬件能夠針對線程組的持續(xù)時間對針對該組線程所檢索的通用數(shù)據(jù)進(jìn)行高速緩存,從而高效地利用紋理硬件內(nèi)的高速緩存資源。
附圖說明
因此,可以詳細(xì)地理解本發(fā)明的上述特征,并且可以參考實(shí)施例得到對如上面所簡要概括的本發(fā)明更具體的描述,其中一些實(shí)施例在附圖中示出。然而,應(yīng)當(dāng)注意的是,附圖僅示出了本發(fā)明的典型實(shí)施例,因此不應(yīng)被認(rèn)為是對其范圍的限制,本發(fā)明可以具有其他等效的實(shí)施例。
圖1是示出了配置為實(shí)現(xiàn)本發(fā)明的一個或多個方面的計(jì)算機(jī)系統(tǒng)的框圖;
圖2是根據(jù)本發(fā)明的一個實(shí)施例的、用于圖1的計(jì)算機(jī)系統(tǒng)的并行處理子系統(tǒng)的框圖;
圖3A是根據(jù)本發(fā)明的一個實(shí)施例的、圖2的前端的框圖;
圖3B是根據(jù)本發(fā)明的一個實(shí)施例的、圖2的并行處理單元之一內(nèi)的通用處理集群的框圖;
圖3C是根據(jù)本發(fā)明的一個實(shí)施例的、圖3B的流多處理器的一部分的框圖;
圖4是根據(jù)本發(fā)明的一個實(shí)施例的、圖2的并行處理單元中的一個或多個可經(jīng)配置以實(shí)現(xiàn)的圖形處理管線的概念圖;
圖5是根據(jù)本發(fā)明的一個實(shí)施例的、圖3B的通用處理集群內(nèi)的紋理單元可經(jīng)配置以實(shí)現(xiàn)的紋理處理管線的概念圖;
圖6是根據(jù)本發(fā)明的一個實(shí)施例的標(biāo)簽表的概念圖;
圖7是根據(jù)本發(fā)明的一個實(shí)施例的、用于經(jīng)由圖5中所示的紋理處理管線來實(shí)施存儲器訪問操作的方法步驟的流程圖;以及
圖8是根據(jù)本發(fā)明的一個實(shí)施例的、用于對與在圖3B中所示的流多處理器上執(zhí)行的一組線程相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行高速緩存和使其無效的方法步驟的流程圖。
具體實(shí)施方式
在下面的描述中,將闡述大量的具體細(xì)節(jié)以提供對本發(fā)明更透徹的理解。然而,本領(lǐng)域的技術(shù)人員應(yīng)該清楚,本發(fā)明可以在沒有一個或多個這些具體細(xì)節(jié)的情況下得以實(shí)施。在其他實(shí)例中,未描述公知特征以避免對本發(fā)明造成混淆。
系統(tǒng)概述
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于輝達(dá)公司,未經(jīng)輝達(dá)公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310704648.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





