[發(fā)明專利]一種任務處理的方法以及任務處理裝置在審
| 申請?zhí)枺?/td> | 201910818221.2 | 申請日: | 2019-08-30 |
| 公開(公告)號: | CN112445587A | 公開(公告)日: | 2021-03-05 |
| 發(fā)明(設計)人: | 陳鐵;肖聰;王平;吳正成;張爭爭 | 申請(專利權)人: | 上海華為技術有限公司 |
| 主分類號: | G06F9/48 | 分類號: | G06F9/48;G06F9/50 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 駱蘇華 |
| 地址: | 201206 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 任務 處理 方法 以及 裝置 | ||
本申請公開了一種任務處理的方法,包括:判斷目標load任務是否滿足第一預設條件,該目標load任務是位于load執(zhí)行隊列首位的load任務;若該目標load任務滿足第一預設條件,則判斷該目標load任務是否滿足第二預設條件;若該目標load任務滿足第二預設條件,則確定該目標load任務具備執(zhí)行條件。本申請實施例還提供相應的任務處理裝置。本申請技術方案可以應用于滿足特定條件的硬件加速器中,減少硬件加速器中的自定義指令執(zhí)行時由于RAW數(shù)據(jù)依賴關系導致的流水時延花銷。
技術領域
本申請涉及計算機技術領域,具體涉及一種任務處理的方法以及任務處理裝置。
背景技術
隨著計算機技術的發(fā)展,由中央處理器和硬件加速器組成的異構計算架構得到廣泛應用,這種異構計算架構可用于提升算法的計算速率。這種異構計算架構的實現(xiàn)原理是將待加速算法分割為小粒度的計算任務,并結合該異構計算架構中的自定義加速器指令(以下簡稱“自定義指令”),完成整個待加速算法的計算。
粗粒度并行計算機(coarse-grained parallel computers)是一種常見的異構計算架構。由于這種異構計算架構的自定義指令的劃分粒度較粗,因此單個自定義指令的執(zhí)行時間較長,對應的流水時延也相應較長。而且,由于粒度較粗的原因,不同的自定義指令間容易有數(shù)據(jù)依賴關系。假設每個自定義指令包含4個load任務(L0、L1、L2、L3)和4個store任務(S0、S1、S2、S3),每個自定義指令的load任務和store任務中間有一段執(zhí)行時間(execute),兩個自定義指令為第一指令和第二指令,該兩個自定義指令的執(zhí)行時序示意圖如圖1。需要說明的是,每個自定義指令所包含的load任務和store任務的實際執(zhí)行時序可以是任意順序,只要保證該自定義指令中的load任務和store任務的執(zhí)行時序符合正常的數(shù)據(jù)依賴關系,圖1所示的只是一種簡單的情況。假設第一指令中的S0和第二指令中的L1的內存地址相同,則該第一指令和第二指令具有數(shù)據(jù)依賴關系,這種數(shù)據(jù)依賴關系具體為寫入后讀取(read after write,RAW)依賴。為避免自定義指令在執(zhí)行過程中因為RAW依賴導致執(zhí)行錯誤,開發(fā)人員會通過靜態(tài)分析(人工判斷或編譯器判斷),在相互依賴的第一指令和第二指令間增加同步(Sync)指令,從而將第二指令的執(zhí)行時間延后至第一指令執(zhí)行完成后,如圖2所示。這種處理方式需要等待8拍(每一拍為執(zhí)行一個load任務或store任務的時間)的時間,為了盡量節(jié)省自定義指令的流水時延,在理想的處理方式中,無需將第二指令的執(zhí)行時間延后至第一指令執(zhí)行完成后,而是將造成數(shù)據(jù)依賴關系的L1的執(zhí)行時間延后至S0執(zhí)行完成后,在L1之前的L0則是正常執(zhí)行,如圖3所示,這樣只需要等待4拍的時間,可以最大限度地減少有數(shù)據(jù)依賴關系的自定義指令等待執(zhí)行的時間,從而減少無謂的流水時延花銷,這種方式也可以稱為動態(tài)數(shù)據(jù)依賴檢測處理。
在自定義指令的實際調度中,L1的執(zhí)行時間有可能晚于S0,因此,該第一指令和第二指令實際上的數(shù)據(jù)依賴關系為“偽數(shù)據(jù)依賴關系”。在靜態(tài)分析中,這種“偽數(shù)據(jù)依賴關系”也會被判斷為數(shù)據(jù)依賴關系,所以第二指令的執(zhí)行時間也需要延后至第一指令執(zhí)行完成后,如圖4所示,這就會造成額外的流水時延花銷,降低了自定義指令的執(zhí)行速率,“偽數(shù)據(jù)依賴關系”的理想處理方式是忽略其存在,正常執(zhí)行自定義指令,這就不會造成流水時延增加。如果可以在靜態(tài)分析的結果中進一步分析出“偽數(shù)據(jù)依賴關系”或者兩個相互依賴的自定義指令中造成數(shù)據(jù)依賴的L1和S0,便可以不用延后第二指令的執(zhí)行時間,或者只針對造成數(shù)據(jù)依賴的L1和S0操作進行相應的處理,從而最大限度地減少無謂的流水時延花銷。
發(fā)明內容
本申請實施例提供了一種任務處理的方法及任務處理裝置,可以應用于滿足特定條件的硬件加速器中,減少硬件加速器中的自定義指令執(zhí)行時由于RAW數(shù)據(jù)依賴關系導致的流水時延花銷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海華為技術有限公司,未經上海華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910818221.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于便攜式電子設備的一鍵多能開關控制電路
- 下一篇:外傷噴劑敷料





