[發(fā)明專利]一種提高圖形處理器處理效率的同步方法有效

申請?zhí)枺?/td>	201410610231.4	申請日：	2014-11-02
公開（公告）號：	CN104361553A	公開（公告）日：	2015-02-18
發(fā)明（設(shè)計）人：	左顥睿;徐智勇;魏宇星;張建林;歐陽益民;許俊平;祁小平	申請（專利權(quán)）人：	中國科學院光電技術(shù)研究所
主分類號：	G06T1/20	分類號：	G06T1/20
代理公司：	北京科迪生專利代理有限責任公司 11251	代理人：	楊學明;賈玉忠
地址：	610209 ***	國省代碼：	四川;51
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種提高圖形處理器處理效率同步方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明屬于高性能計算特別是并行計算領(lǐng)域。具體涉及一種提高圖形處理器處理效率的同步方法。

背景技術(shù)

圖形處理器是一種高性能并行處理器，已廣泛應(yīng)用于多個領(lǐng)域，包括圖像處理、金融分析、石油勘探、物理建模和氣象分析等領(lǐng)域。圖形處理器的任務(wù)處理模型可以分為三級：核級、塊級、線程級。每個任務(wù)可以包含多個核，每個核可以包含多個塊，每個塊可以包含多個線程。

然而，目前圖形處理器主要應(yīng)用于實驗室仿真或事后處理系統(tǒng)，極少應(yīng)用于實時處理系統(tǒng)。這主要是因為目前所有的圖形處理器均需要計算機系統(tǒng)進行控制，計算機系統(tǒng)加載核到圖形處理器上進行運算，當圖形處理器處理完一個核后，必須退出圖形處理器并返回計算機系統(tǒng)，用于完成處理結(jié)果的同步。當一個任務(wù)由多個核組成時，計算機系統(tǒng)需要加載多次核，圖形處理器也需要多次啟動和返回計算機系統(tǒng)，這極大的影響了圖像處理器的處理效率。導(dǎo)致很多情況下，啟動和同步圖形處理器處理結(jié)果的時間大大超過圖形處理器處理任務(wù)的間。

目前，圖形處理器在只提供了線程級的同步，沒有提供塊級同步的方法，必須退出圖形處理器返回計算機系統(tǒng)才能完成塊級同步，這是導(dǎo)致圖形處理器在執(zhí)行多個核組成任務(wù)時效率低的根本原因。要提高圖形處理器的利用效率，迫切需要一種高效的塊間同步方法。

發(fā)明內(nèi)容

本發(fā)明技術(shù)解決問題：針對現(xiàn)有技術(shù)的不足，提供一種提高圖形處理器處理效率的同步方法，在保證處理結(jié)果一致的基礎(chǔ)上，提高圖形處理器的處理效率。

為實現(xiàn)這樣的目的，本發(fā)明的技術(shù)方案：一種提高圖形處理器處理效率的同步方法，包括如下步驟：

步驟一、圖形處理器在處理一個由n個核組成的任務(wù)時(n≥2)，當前執(zhí)行核t進入同步(1≤t＜n)處理；

步驟二、圖形處理器建立同步輸入向量和同步輸出向量，當圖形處理器的處理分塊數(shù)目為m時(m≥1)。首先建立同步輸入向量A，同步輸入向量A的大小等于圖形處理器的處理分塊數(shù)目m，表示為A{i}，i＝{1,2,...,m}；然后建立同步輸出向量B，同步輸出向量B的大小等于圖形處理器的處理分塊數(shù)目m，表示為B{i}，i＝{1,2,...,m}；

步驟三、圖形處理器更新同步輸入向量，塊i更新同步輸入向量A[i]值為Flag；

步驟四、圖形處理器判斷同步輸入向量是否完成更新，用任意一個塊對同步輸入向量A的值進行循環(huán)查詢，判斷同步輸入向量A中的標志是否全部被更新為Flag，如果完成更新，執(zhí)行步驟五，未完成更新，繼續(xù)執(zhí)行步驟四；

步驟五、圖形處理器更新同步輸出向量，使用步驟四中的塊更新同步輸出向量B的值為Flag；

步驟六、圖形處理器判斷同步輸出向量是否完成更新，塊i判斷同步輸出向量B[i]值是否為Flag，如果同步輸出向量B中所有值均被更新為Flag，完成更新，執(zhí)行步驟七，未完成更新，繼續(xù)執(zhí)行步驟六；

步驟七、圖形處理器完成當前執(zhí)行核t的同步處理。

本發(fā)明與現(xiàn)有技術(shù)相比的有益效果在于：

本發(fā)明提出的提高圖形處理器處理效率的同步方法，在執(zhí)行由多個核組成的任務(wù)時，可以在圖形處理器內(nèi)完成塊間同步，避免了圖形處理器因塊間同步多次返回計算機系統(tǒng)，圖形處理器處理效率低的問題。

附圖說明

圖1為本發(fā)明方法實現(xiàn)流程圖；

圖2為一個由多個核組成的任務(wù)示意圖，該任務(wù)分為n個核，每個核由m個塊組成，每個塊由u個線程組成；

圖3為采用本發(fā)明后，圖形處理器在處理如圖2所示的由多核組成任務(wù)時的處理流程圖。

具體實施方式

為了更好的了解本發(fā)明的技術(shù)方案，下面結(jié)合附圖對本發(fā)明的實施例作詳細說明。

在處理一個如圖2所示的由多個核組成的任務(wù)時，如圖1所示，本發(fā)明提供了一種提高圖形處理器處理效率的同步方法，實施步驟如下：

步驟一、圖形處理器在處理一個由n個核組成的任務(wù)時，當前執(zhí)行核進入同步：圖形處理器在第t個核(1≤t＜n)完成處理任務(wù)后，進入同步處理；

步驟二、圖形處理器建立同步輸入向量和同步輸出向量：當圖形處理器的處理分塊數(shù)目為m時，首先建立同步輸入向量A，同步輸入向量A的大小等于圖形處理器的處理分塊數(shù)目m，表示為A{i}，i＝{1,2,...,m}；然后建立同步輸出向量B，同步輸出向量B的大小等于圖形處理器的處理分塊數(shù)目m，表示為B{i}，i＝{1,2,...,m}；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院光電技術(shù)研究所，未經(jīng)中國科學院光電技術(shù)研究所許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201410610231.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06T 一般的圖像數(shù)據(jù)處理或產(chǎn)生
G06T1-00 通用圖像數(shù)據(jù)處理
G06T1-20 .處理器結(jié)構(gòu)；處理器配置，例如流水線
G06T1-60 .存儲器管理
G06T1-40 ..神經(jīng)網(wǎng)絡(luò)

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】