[發(fā)明專利]多線程處理單元中可編程的混合無效
| 申請?zhí)枺?/td> | 201310714673.9 | 申請日: | 2013-12-20 |
| 公開(公告)號: | CN103885752A | 公開(公告)日: | 2014-06-25 |
| 發(fā)明(設(shè)計)人: | 魯伊·M·巴斯托斯;馬克·J·基爾加德;威廉·克雷格·麥克奈特;杰爾姆·F·杜魯克;皮特爾·蘇伊洛特;戴爾·L·柯克蘭;克里斯蒂安·阿姆辛克;約瑟夫·德特姆;克里斯蒂安·魯埃;唐·比特爾 | 申請(專利權(quán))人: | 輝達公司 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38 |
| 代理公司: | 北京市磐華律師事務(wù)所 11336 | 代理人: | 董巍;謝栒 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 多線程 處理 單元 可編程 混合 | ||
技術(shù)領(lǐng)域
本發(fā)明概括地來說涉及的是多線程計算機架構(gòu),更具體地,涉及的是多線程處理單元中可編程的混合。
背景技術(shù)
本領(lǐng)域已知的許多重要的圖形渲染標準,如OpenVG、SVG、Cairo、Skia、JavaFX、Adobe?Flash、Adobe?PDF、Apple’s?Quartz2D和HTML5需要不能直接得到常規(guī)的圖形處理單元(GPU)支持的復雜的混合模式。因此,根據(jù)這些圖形渲染標準所格式化的圖形內(nèi)容通常由中央處理單元(CPU)進行渲染,中央處理單元利用一般的處理操作能夠?qū)崿F(xiàn)所述復雜的混合模式。然而,與GPU相比,CPU不能提供有效、高吞吐量的處理,從而潛在地導致用于所述圖形內(nèi)容的相當?shù)偷幕贑PU的渲染性能。
常規(guī)的GPU將圖形渲染工作組織為一系列的圖形對象,所述圖形對象各自分解為一系列片段(fragments),然后這些片段被傳送到片段著色器。所述片段著色器計算用于每個片段的顏色并生成相應(yīng)的經(jīng)著色的片段,所述經(jīng)著色的片段典型地包括顏色和不透明度信息。然后每個經(jīng)著色的片段被傳送到顏色光柵操作(CROP)單元,所述顏色光柵操作單元配置為將所述經(jīng)著色的片段與針對存儲在幀緩沖區(qū)的相應(yīng)的像素的顏色數(shù)據(jù)進行混合。所述CROP單元照常利用兩個乘積電路的固定函數(shù)的和,來實施該混合操作,所述CROP單元沒有直接實現(xiàn)所述復雜的混合模式。
GPU內(nèi)的所述圖形渲染標準所需要的復雜的混合模式的一種執(zhí)行方法是對片段著色器進行編程,以實現(xiàn)所述復雜的混合模式。盡管片段著色器是高度可編程的,且能夠執(zhí)行所述復雜的混合模式,但在常規(guī)的GPU中,從所述片段著色器到幀緩沖區(qū)存儲器的讀寫延遲是足夠長的,以致渲染性能受損且很有可能降到在同時期的CPU上可達到的渲染性能之下。
如前面所說明的,本領(lǐng)域所需的是用于在GPU內(nèi)有效地渲染復雜的混合模式的技術(shù)。
發(fā)明內(nèi)容
本發(fā)明的一個實施例闡述了用于實施可編程的混合操作的方法,所述方法包括基于與所述可編程混合操作相關(guān)聯(lián)的指令序列接收至少用于處理的源像素數(shù)據(jù)或目標(destination)像素數(shù)據(jù),確定需要第一混合操作,其中所述第一混合操作由來自所述指令序列的第一指令指定,執(zhí)行所述第一混合操作以生成第一混合結(jié)果,執(zhí)行第二混合操作以生成第二混合結(jié)果,其中所述第二混合操作由來自所述指令序列的第二指令指定,和存儲所述第二混合結(jié)果。所述可編程的混合操作可以指定具有任意數(shù)目的指令的任意指令序列。
本發(fā)明的其它實施例包括但不限于,包含指令的計算機可讀的存儲介質(zhì),當處理單元執(zhí)行所述指令時,使得所述處理單元實施本文所描述的技術(shù),以及計算機設(shè)備,所述計算機設(shè)備包含配置為實施本文所描述的技術(shù)的處理單元。
所公開的技術(shù)的一個優(yōu)勢是,它能夠使需要復雜的混合模式的圖形內(nèi)容高效地由圖形處理單元進行渲染。
附圖說明
因此,可以詳細地理解本發(fā)明的上述特征,并且可以參考實施例得到對如上面所簡要概括的本發(fā)明更具體的描述,其中一些實施例在附圖中示出。然而,應(yīng)當注意的是,附圖僅示出了本發(fā)明的典型實施例,因此不應(yīng)被認為是對其范圍的限制,本發(fā)明可以具有其它等效的實施例。
圖1是示出了配置為實現(xiàn)本發(fā)明的一個或多個方面的計算機系統(tǒng)的框圖;
圖2是根據(jù)本發(fā)明的一個實施例的、用于圖1的計算機系統(tǒng)的并行處理子系統(tǒng)的框圖;
圖3A是根據(jù)本發(fā)明的一個實施例的、圖2的前端的框圖;
圖3B是根據(jù)本發(fā)明的一個實施例的、圖2的并行處理單元(PPU)之一內(nèi)的通用處理集群的框圖;
圖3C是根據(jù)本發(fā)明的一個實施例的、圖3B的流多處理器的一部分的框圖;
圖4是根據(jù)本發(fā)明的一個實施例的、圖形處理管線的概念性示意圖,圖2中的一個或多個PPU可配置為實現(xiàn)所述圖形處理管線;
圖5示出了根據(jù)本發(fā)明的一個實施例的配置實現(xiàn)一遍(one?pass)迭代混合操作的混合電路;
圖6示出了根據(jù)本發(fā)明的一個實施例的配置為實現(xiàn)迭代的混合操作的顏色光柵操作混合單元;
圖7是根據(jù)本發(fā)明的一個實施例的用于配制顏色光柵操作混合單元以執(zhí)行迭代的混合操作的方法步驟的流程圖;
圖8是根據(jù)本發(fā)明的一個實施例的用于實施混合操作的方法步驟的流程圖。
具體實施方式
在下面的描述中,將闡述大量的具體細節(jié)以提供對本發(fā)明更透徹的理解。然而,本領(lǐng)域的技術(shù)人員應(yīng)該清楚,本發(fā)明可以在沒有一個或多個這些具體細節(jié)的情況下得以實施。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于輝達公司,未經(jīng)輝達公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310714673.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多線程應(yīng)用系統(tǒng)的異常處理方法和異常處理裝置
- 一種面向片上網(wǎng)絡(luò)的多線程調(diào)度實現(xiàn)方法
- 基于計算機多線程多核顯微鏡細胞圖像快速掃描處理方法
- 一種基于同步鎖的多線程處理方法、終端以及存儲介質(zhì)
- 多線程并發(fā)處理系統(tǒng)及方法
- 海外控股估值流程控制方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 讀數(shù)方法、電子裝置、計算機設(shè)備及存儲介質(zhì)
- 一種基于云平臺多線程調(diào)度的方法、系統(tǒng)、設(shè)備及介質(zhì)
- 一種基于云平臺的前端多線程調(diào)度方法和系統(tǒng)
- 多線程調(diào)度方法、裝置、電子設(shè)備及存儲介質(zhì)





