[發明專利]一種提高芯片計算性能的方法、系統、設備及介質有效
| 申請號: | 201911385640.8 | 申請日: | 2019-12-29 |
| 公開(公告)號: | CN111176731B | 公開(公告)日: | 2023-01-06 |
| 發明(設計)人: | 李拓 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06F9/38 | 分類號: | G06F9/38;G06F13/28 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 張濤 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提高 芯片 計算 性能 方法 系統 設備 介質 | ||
本發明公開了一種提高芯片計算性能的方法、系統、設備和存儲介質,方法包括以下步驟:通用處理器核心將計算任務分解成多個并行的子任務,并將多個子任務分配到并行控制陣列;并行控制陣列對多個子任務進行預處理,并將預處理后的子任務分配到與并行控制陣列對應的計算加速單元陣列;判斷計算加速單元陣列中的每個計算單元是否能夠處理所分配的子任務;以及響應于計算加速單元陣列中的計算單元不能夠處理所分配的子任務,將子任務分配給其他的計算單元。本發明提出的提高芯片計算性能的方法、系統、設備及介質通過增加并行控制陣列進行數據預處理,計算加速單元陣列只進行專門的計算,提高了計算的性能。
技術領域
本發明涉及計算領域,更具體地,特別是指一種提高芯片計算性能的方法、系統、計算機設備及可讀介質。
背景技術
作為AI(Artificial Intelligence,人工智能)計算加速的協處理器,最主流的就是GPU(Graphics Processing Unit,圖形處理器),憑借集成上千并行計算核心,GPU能提供最強的AI計算性能。但GPU的問題在于價格和功耗。所以一些全定制化的AI芯片針對特定場景,對芯片架構進行定制化的優化設計,在對成本和功耗敏感的AI領域獲得了應用。而半定制化(FPGA(Field Programmable Gate Array,現場可編程門陣列))的AI芯片,主要應用在一些實驗性的領域,以及對性能要求不那么嚴苛的領域。
在各種AI處理中,各種深度學習算法的大規模并行計算需要加速器,這些計算的特點是單個計算并不十分復雜,但是并行度高,且為了提高效率,計算和中間結果存儲的數據位寬往往是定制的和較小的(比如8位、16位)。正是因為這些特點,CPU這種單核比較復雜的通用型處理器在進行AI計算中效率很低。在AI加速芯片中集成單個或少數幾個處理器核心的方案,往往需要考慮高昂的IP費用以及處理器核心本身帶來的對芯片資源和面積的占用。但是這樣的方案會存在比較難實現通用性的問題,即對不同應用場景不同規模算法的支持很難做到高效。
發明內容
有鑒于此,本發明實施例的目的在于提出一種提高芯片計算性能的方法、系統、計算機設備及計算機可讀存儲介質,通過增加并行控制陣列進行數據預處理,計算加速單元陣列只進行專門的計算,提高了計算的性能,另外,芯片架構充分考慮到了芯片的通用性,多核心靈活擴展的架構能在多種不同的場景需求下支持芯片的設計和擴展。
基于上述目的,本發明實施例的一方面提供了一種提高芯片計算性能的方法,包括如下步驟:通用處理器核心將計算任務分解成多個并行的子任務,并將多個所述子任務分配到并行控制陣列;所述并行控制陣列對多個所述子任務進行預處理,并將預處理后的子任務分配到與所述并行控制陣列對應的計算加速單元陣列;判斷所述計算加速單元陣列中的每個計算單元是否能夠處理所分配的子任務;以及響應于所述計算加速單元陣列中的計算單元不能夠處理所分配的子任務,將所述子任務分配給其他的計算單元。
在一些實施方式中,還包括:響應于所述計算加速單元陣列中的計算單元能夠處理所分配的子任務,將處理結果發送到內存或所述通用處理器核心。
在一些實施方式中,響應于所述計算加速單元陣列中的計算單元能夠處理所分配的子任務,將處理結果發送到內存或所述通用處理器核心包括:判斷所述子任務處理過程中產生的中間數據的量是否超過閾值;以及響應于所述子任務處理過程中產生的中間數據的量不超過閾值,將所述中間數據寫入所述并行控制陣列的緩存。
在一些實施方式中,還包括:響應于所述子任務處理過程中產生的中間數據的量超過閾值,將所述超過閾值的中間數據寫入所述計算加速單元陣列掛載的附加緩存中。
在一些實施方式中,響應于所述計算加速單元陣列中的計算單元能夠處理所分配的子任務,將處理結果發送到內存或所述通用處理器核心包括:判斷計算過程中的數據是否能夠通過所述計算加速單元陣列的網絡進行傳輸;以及響應于計算過程中的數據不能夠通過所述計算加速單元陣列的網絡進行傳輸,采用所述并行控制陣列中的處理器核心進行傳輸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911385640.8/2.html,轉載請聲明來源鉆瓜專利網。





