[發(fā)明專(zhuān)利]改進(jìn)圖形處理單元上的鏈?zhǔn)饺蝿?wù)的性能的方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201380080434.0 | 申請(qǐng)日: | 2013-11-22 |
| 公開(kāi)(公告)號(hào): | CN105683914B | 公開(kāi)(公告)日: | 2019-09-24 |
| 發(fā)明(設(shè)計(jì))人: | W.陳;L-A.唐;路奎元;H.袁;S.蘇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 英特爾公司 |
| 主分類(lèi)號(hào): | G06F9/46 | 分類(lèi)號(hào): | G06F9/46 |
| 代理公司: | 中國(guó)專(zhuān)利代理(香港)有限公司 72001 | 代理人: | 李雪娜;張濤 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 改進(jìn) 圖形 處理 單元 鏈?zhǔn)?/a> 任務(wù) 性能 方法 裝置 | ||
在實(shí)施例中,至少一個(gè)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)具有存儲(chǔ)在其上的指令以用于使系統(tǒng)從處理器向任務(wù)執(zhí)行設(shè)備發(fā)送第一調(diào)用以執(zhí)行鏈?zhǔn)阶永痰募系牡谝蛔永獭5谝蛔永炭梢跃哂械谝蛔永梯敵鲎冊(cè)龅谝蛔永梯敵鲎冊(cè)ㄖ甘緛?lái)自第一子例程的執(zhí)行的第一輸出數(shù)據(jù)是鏈?zhǔn)阶永痰募系闹虚g數(shù)據(jù)的第一令牌。指令還用于使系統(tǒng)響應(yīng)于在第一子例程輸出變?cè)邪ǖ谝涣钆贫沟锰幚砥髂軌蛟谌蝿?wù)執(zhí)行設(shè)備執(zhí)行第一子例程的同時(shí)執(zhí)行一個(gè)或多個(gè)操作。描述和要求保護(hù)其它實(shí)施例。
技術(shù)領(lǐng)域
實(shí)施例涉及圖形處理單元(GPU)上的鏈?zhǔn)剑╟hained)任務(wù)的性能的改進(jìn)。
背景技術(shù)
視頻算法通常可以分解成一系列簡(jiǎn)單基本算法。例如,邊緣檢測(cè)算法可以分解成“卷積”、“加法”等。視頻加速度器庫(kù)可以加速這些基本算法,當(dāng)在圖形處理單元(GPU)上被執(zhí)行時(shí)。
當(dāng)一個(gè)GPU任務(wù)分解成許多GPU任務(wù)時(shí),至少兩個(gè)因素可以影響性能。第一因素是與GPU和主機(jī)(host)處理器之間的數(shù)據(jù)遞送相關(guān)聯(lián)的開(kāi)銷(xiāo)。第二因素是與GPU任務(wù)的設(shè)置(setup)相關(guān)聯(lián)的開(kāi)銷(xiāo)。例如,單個(gè)GPU任務(wù)需要一次設(shè)置。在任務(wù)分解成若干任務(wù)之后(盡管每一個(gè)任務(wù)非常小),每一個(gè)GPU任務(wù)需要被設(shè)置。每一個(gè)因素可以導(dǎo)致與任務(wù)性能相關(guān)聯(lián)的增加的等待時(shí)間。
附圖說(shuō)明
圖1是根據(jù)本發(fā)明的實(shí)施例的系統(tǒng)的框圖。
圖2是根據(jù)本發(fā)明的實(shí)施例的通過(guò)耦合到圖形處理單元(GPU)的處理器處理鏈?zhǔn)街噶畹姆桨浮?/p>
圖3是根據(jù)本發(fā)明的實(shí)施例的處理系統(tǒng)中的鏈?zhǔn)街噶畹姆椒ǖ牧鞒虉D。
圖4是根據(jù)本發(fā)明的實(shí)施例的時(shí)間線圖。
圖5是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行鏈?zhǔn)街噶畹姆椒ǖ牧鞒虉D。
圖6是依照本發(fā)明的實(shí)施例的處理器的框圖。
圖7是依照本發(fā)明的另一實(shí)施例的多域處理器的框圖。
圖8是依照本發(fā)明的實(shí)施例的另一系統(tǒng)的框圖。
具體實(shí)施方式
根據(jù)本發(fā)明的實(shí)施例,鏈?zhǔn)街噶畹膱?zhí)行可以通過(guò)諸如GPU之類(lèi)的任務(wù)執(zhí)行單元與主機(jī)的處理器之間的數(shù)據(jù)遞送開(kāi)銷(xiāo)的降低來(lái)增強(qiáng)。根據(jù)本發(fā)明的實(shí)施例,鏈?zhǔn)街噶畹膱?zhí)行可以通過(guò)在實(shí)施圖形算法的執(zhí)行的同時(shí)執(zhí)行GPU設(shè)置開(kāi)銷(xiāo)來(lái)進(jìn)一步增強(qiáng)。
例如,裁剪和疊加操作是一些圖形算法的兩個(gè)操作,例如從第一圖像裁剪子圖像,并且然后將該子圖像粘貼(疊加)到第二圖像中。要由耦合到GPU的主機(jī)的處理器執(zhí)行的應(yīng)用編程接口(API)可以如下:crop (srcImage,…,subImage); overlay (subImage,…,targetImage)。最初,可以將源圖像從主機(jī)存儲(chǔ)器拷貝到圖形存儲(chǔ)器。其次,主機(jī)處理器可以設(shè)置用于裁剪的運(yùn)行上下文,例如確定GPU運(yùn)行由裁剪API調(diào)用的裁剪圖形子例程所需要的設(shè)置參數(shù)。然后主機(jī)向GPU發(fā)布裁剪任務(wù)以執(zhí)行,并且主機(jī)等待GPU完成裁剪任務(wù)。當(dāng)裁剪任務(wù)(例如子例程)結(jié)束時(shí),主機(jī)典型地將子圖像從圖形存儲(chǔ)器拷貝到主機(jī)存儲(chǔ)器。
主機(jī)準(zhǔn)備用于疊加任務(wù)的數(shù)據(jù),包括將子圖像拷貝到圖形存儲(chǔ)器,以及將目標(biāo)圖像拷貝到圖形存儲(chǔ)器。主機(jī)設(shè)置用于疊加的運(yùn)行上下文。主機(jī)向GPU發(fā)布疊加任務(wù)以運(yùn)行并且主機(jī)等待GPU任務(wù)完成。疊加任務(wù)運(yùn)行結(jié)束,并且主機(jī)將目標(biāo)圖像拷貝到主機(jī)存儲(chǔ)器。
在前述示例中,裁剪任務(wù)的輸出是疊加任務(wù)的輸入,并且GPU與主機(jī)處理器之間的子圖像的拷貝是非必要的,因?yàn)樽訄D像是中間結(jié)果。效率的損失還由處理器空閑而同時(shí)GPU繁忙引起。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201380080434.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)





