[發(fā)明專利]一種提高圖形處理器處理效率的同步方法有效
| 申請?zhí)枺?/td> | 201410610231.4 | 申請日: | 2014-11-02 |
| 公開(公告)號: | CN104361553A | 公開(公告)日: | 2015-02-18 |
| 發(fā)明(設(shè)計)人: | 左顥睿;徐智勇;魏宇星;張建林;歐陽益民;許俊平;祁小平 | 申請(專利權(quán))人: | 中國科學院光電技術(shù)研究所 |
| 主分類號: | G06T1/20 | 分類號: | G06T1/20 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 楊學明;賈玉忠 |
| 地址: | 610209 *** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 提高 圖形 處理器 處理 效率 同步 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于高性能計算特別是并行計算領(lǐng)域。具體涉及一種提高圖形處理器處理效率的同步方法。
背景技術(shù)
圖形處理器是一種高性能并行處理器,已廣泛應(yīng)用于多個領(lǐng)域,包括圖像處理、金融分析、石油勘探、物理建模和氣象分析等領(lǐng)域。圖形處理器的任務(wù)處理模型可以分為三級:核級、塊級、線程級。每個任務(wù)可以包含多個核,每個核可以包含多個塊,每個塊可以包含多個線程。
然而,目前圖形處理器主要應(yīng)用于實驗室仿真或事后處理系統(tǒng),極少應(yīng)用于實時處理系統(tǒng)。這主要是因為目前所有的圖形處理器均需要計算機系統(tǒng)進行控制,計算機系統(tǒng)加載核到圖形處理器上進行運算,當圖形處理器處理完一個核后,必須退出圖形處理器并返回計算機系統(tǒng),用于完成處理結(jié)果的同步。當一個任務(wù)由多個核組成時,計算機系統(tǒng)需要加載多次核,圖形處理器也需要多次啟動和返回計算機系統(tǒng),這極大的影響了圖像處理器的處理效率。導(dǎo)致很多情況下,啟動和同步圖形處理器處理結(jié)果的時間大大超過圖形處理器處理任務(wù)的間。
目前,圖形處理器在只提供了線程級的同步,沒有提供塊級同步的方法,必須退出圖形處理器返回計算機系統(tǒng)才能完成塊級同步,這是導(dǎo)致圖形處理器在執(zhí)行多個核組成任務(wù)時效率低的根本原因。要提高圖形處理器的利用效率,迫切需要一種高效的塊間同步方法。
發(fā)明內(nèi)容
本發(fā)明技術(shù)解決問題:針對現(xiàn)有技術(shù)的不足,提供一種提高圖形處理器處理效率的同步方法,在保證處理結(jié)果一致的基礎(chǔ)上,提高圖形處理器的處理效率。
為實現(xiàn)這樣的目的,本發(fā)明的技術(shù)方案:一種提高圖形處理器處理效率的同步方法,包括如下步驟:
步驟一、圖形處理器在處理一個由n個核組成的任務(wù)時(n≥2),當前執(zhí)行核t進入同步(1≤t<n)處理;
步驟二、圖形處理器建立同步輸入向量和同步輸出向量,當圖形處理器的處理分塊數(shù)目為m時(m≥1)。首先建立同步輸入向量A,同步輸入向量A的大小等于圖形處理器的處理分塊數(shù)目m,表示為A{i},i={1,2,...,m};然后建立同步輸出向量B,同步輸出向量B的大小等于圖形處理器的處理分塊數(shù)目m,表示為B{i},i={1,2,...,m};
步驟三、圖形處理器更新同步輸入向量,塊i更新同步輸入向量A[i]值為Flag;
步驟四、圖形處理器判斷同步輸入向量是否完成更新,用任意一個塊對同步輸入向量A的值進行循環(huán)查詢,判斷同步輸入向量A中的標志是否全部被更新為Flag,如果完成更新,執(zhí)行步驟五,未完成更新,繼續(xù)執(zhí)行步驟四;
步驟五、圖形處理器更新同步輸出向量,使用步驟四中的塊更新同步輸出向量B的值為Flag;
步驟六、圖形處理器判斷同步輸出向量是否完成更新,塊i判斷同步輸出向量B[i]值是否為Flag,如果同步輸出向量B中所有值均被更新為Flag,完成更新,執(zhí)行步驟七,未完成更新,繼續(xù)執(zhí)行步驟六;
步驟七、圖形處理器完成當前執(zhí)行核t的同步處理。
本發(fā)明與現(xiàn)有技術(shù)相比的有益效果在于:
本發(fā)明提出的提高圖形處理器處理效率的同步方法,在執(zhí)行由多個核組成的任務(wù)時,可以在圖形處理器內(nèi)完成塊間同步,避免了圖形處理器因塊間同步多次返回計算機系統(tǒng),圖形處理器處理效率低的問題。
附圖說明
圖1為本發(fā)明方法實現(xiàn)流程圖;
圖2為一個由多個核組成的任務(wù)示意圖,該任務(wù)分為n個核,每個核由m個塊組成,每個塊由u個線程組成;
圖3為采用本發(fā)明后,圖形處理器在處理如圖2所示的由多核組成任務(wù)時的處理流程圖。
具體實施方式
為了更好的了解本發(fā)明的技術(shù)方案,下面結(jié)合附圖對本發(fā)明的實施例作詳細說明。
在處理一個如圖2所示的由多個核組成的任務(wù)時,如圖1所示,本發(fā)明提供了一種提高圖形處理器處理效率的同步方法,實施步驟如下:
步驟一、圖形處理器在處理一個由n個核組成的任務(wù)時,當前執(zhí)行核進入同步:圖形處理器在第t個核(1≤t<n)完成處理任務(wù)后,進入同步處理;
步驟二、圖形處理器建立同步輸入向量和同步輸出向量:當圖形處理器的處理分塊數(shù)目為m時,首先建立同步輸入向量A,同步輸入向量A的大小等于圖形處理器的處理分塊數(shù)目m,表示為A{i},i={1,2,...,m};然后建立同步輸出向量B,同步輸出向量B的大小等于圖形處理器的處理分塊數(shù)目m,表示為B{i},i={1,2,...,m};
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院光電技術(shù)研究所,未經(jīng)中國科學院光電技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410610231.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





