[發(fā)明專利]一種GPU紋素并行獲取方法在審
| 申請?zhí)枺?/td> | 201911147122.2 | 申請日: | 2019-11-21 |
| 公開(公告)號: | CN110930493A | 公開(公告)日: | 2020-03-27 |
| 發(fā)明(設(shè)計(jì))人: | 鄭新建;田澤;韓立敏;任向隆;張駿;張琛 | 申請(專利權(quán))人: | 中國航空工業(yè)集團(tuán)公司西安航空計(jì)算技術(shù)研究所 |
| 主分類號: | G06T15/00 | 分類號: | G06T15/00;G06T15/04 |
| 代理公司: | 北京清大紫荊知識產(chǎn)權(quán)代理有限公司 11718 | 代理人: | 李紅 |
| 地址: | 710065 陜西省*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 gpu 并行 獲取 方法 | ||
本發(fā)明涉及計(jì)算機(jī)硬件技術(shù)領(lǐng)域,具體涉及GPU的紋理采樣,尤其涉及一種GPU紋素并行獲取方法,將紋理過濾單元中的采樣單元功能設(shè)置于DDR控制器內(nèi)部,由DDR控制器內(nèi)部實(shí)現(xiàn)紋素過濾,并將過濾后的紋素通過紋理Cache單元返回給統(tǒng)一染色陣列單元,在Cache缺失時觸發(fā)進(jìn)行紋理過濾電路工作。該方法可以減少紋理訪問的存儲帶寬需求,增加紋理Cache的利用率,只有Cache缺失時才觸發(fā)進(jìn)行紋理采樣電路工作,降低了系統(tǒng)功耗。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)硬件技術(shù)領(lǐng)域,具體涉及GPU的紋理采樣,尤其涉及一種GPU紋素并行獲取方法。
背景技術(shù)
3D圖形繪制的紋理映射功能存在大量需要被貼圖的片段,每個片段的紋理過濾時會發(fā)出多個紋理存儲器訪問請求,紋理存儲器需要為紋理過濾單元提供“高帶寬、低延遲”的紋理數(shù)據(jù),而3D圖形繪制中大量的紋理數(shù)據(jù)需要存儲在片外的DDR存儲器上,一般采用紋理Cache和紋理壓縮等方式降低紋素?cái)?shù)據(jù)的帶寬占用。
傳統(tǒng)的紋理貼圖過程是首先由紋理采樣單元計(jì)算紋素地址,并將紋素地址發(fā)送給紋理Cache單元,然后由紋理Cache單元負(fù)責(zé)從DDR控制器中獲取并返回多個紋素后送給紋理過濾單元,最后由紋素過濾單元按照采樣模式進(jìn)行紋素過濾后送給統(tǒng)一染色陣列單元進(jìn)行染色。傳統(tǒng)的紋理貼圖過程從Cache系統(tǒng)獲取的是紋素的原始值,這對Cache系統(tǒng)帶來了極大的帶寬壓力;以雙線性過濾為例,每個貼圖像素點(diǎn)需要獲取4個紋素值,由這4個紋素值進(jìn)行過濾后生成該像素點(diǎn)使用的紋素值。這樣Cache系統(tǒng)和DDR需要必須提供4倍于像素點(diǎn)的帶寬。而實(shí)際最終送給統(tǒng)一著色陣列進(jìn)行著色的仍然只有1個像素值,在一些資源有限但對性能要求很高的嵌入式應(yīng)用中,這種存儲帶寬的問題會導(dǎo)致系統(tǒng)性能極大下降。
發(fā)明內(nèi)容
為了解決上述缺陷,本發(fā)明描述了一種GPU紋素并行獲取方法及電路,減少紋理訪問的存儲帶寬需求,增加紋理Cache的利用率,降低了系統(tǒng)功耗。
本發(fā)明的具體技術(shù)方案為:
本發(fā)明提出一種GPU紋素并行獲取方法,該方法為:將紋理過濾單元中的采樣單元功能設(shè)置于DDR控制器內(nèi)部,由DDR控制器內(nèi)部實(shí)現(xiàn)紋素過濾,并將過濾后的紋素通過紋理Cache單元返回給統(tǒng)一染色陣列單元,在Cache缺失時觸發(fā)進(jìn)行紋理過濾電路工作。
為了減少紋理訪問的存儲帶寬需求,增加紋理Cache的利用率并降低系統(tǒng)功耗,所述方法通過GPU紋素并行獲取電路實(shí)現(xiàn),所述GPU紋素并行獲取電路包括紋理采樣單元、紋理Cache單元、紋理數(shù)據(jù)存儲DDR及其控制器單元和統(tǒng)一染色陣列單元;所述紋理采樣單元、紋理Cache單元和統(tǒng)一染色陣列單元依次連接,所述紋理數(shù)據(jù)存儲DDR及其控制器單元連接至紋理Cache單元;
所述紋理采樣單元用于紋理參數(shù)獲取和紋理地址計(jì)算;
所述紋理Cache單元用于從DDR中獲取紋素?cái)?shù)據(jù);
所述紋理數(shù)據(jù)存儲DDR及其控制器單元用于存儲紋素?cái)?shù)據(jù),并實(shí)現(xiàn)紋素內(nèi)部過濾;
所述統(tǒng)一染色陣列單元用于紋素貼圖操作。
進(jìn)一步限定,所述紋理采樣單元用于執(zhí)行紋理參數(shù)和紋素地址計(jì)算,并將計(jì)算后的紋素地址發(fā)送給紋理Cache單元;
為了提高總體帶寬和吞吐率、減少延遲、增強(qiáng)并發(fā)性并使其適用于多紋理流水線的處理,所述紋理Cache單元用于接收紋理采樣單元送來的紋素地址,獲取紋素?cái)?shù)據(jù)并返回給統(tǒng)一染色陣列單元;紋理Cache單元內(nèi)部集成一級Cache和二級Cache,一級Cache根據(jù)紋理需求劃分為多個子Cache;一級Cache采用多Bank、多端口、非阻塞和流水線設(shè)計(jì),同時為多個并發(fā)的紋理流水線提供多組紋理數(shù)據(jù);二級Cache采用流水線設(shè)計(jì),內(nèi)部采用壓縮存儲。
進(jìn)一步限定:所述紋理數(shù)據(jù)存儲DDR及其控制器單元內(nèi)置有紋理比較單元和紋素過濾單元;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國航空工業(yè)集團(tuán)公司西安航空計(jì)算技術(shù)研究所,未經(jīng)中國航空工業(yè)集團(tuán)公司西安航空計(jì)算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911147122.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖形處理器任務(wù)的分配方法和裝置
- 一種資源調(diào)度裝置、資源調(diào)度系統(tǒng)和資源調(diào)度方法
- 一種免工具GPU支架固定裝置
- 一種YARN集群GPU資源調(diào)度方法、裝置和介質(zhì)
- 一種服務(wù)器內(nèi)4GPU布局結(jié)構(gòu)及其安裝方法
- 一種GPU資源調(diào)度系統(tǒng)及其調(diào)度方法
- 一種GPU拓?fù)浞謪^(qū)方法與裝置
- 一種基于Kubernetes的共享GPU調(diào)度方法
- 一種數(shù)據(jù)處理的方法和裝置
- 一種GPU分配方法、系統(tǒng)、存儲介質(zhì)及設(shè)備





