[發明專利]一種異構計算設備計算能力測算的方法有效
| 申請號: | 202211320824.8 | 申請日: | 2022-10-26 |
| 公開(公告)號: | CN115543911B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 董建;鮑薇;徐洋;楊雨澤;劉祥龍 | 申請(專利權)人: | 中國電子技術標準化研究院 |
| 主分類號: | G06F15/78 | 分類號: | G06F15/78;G06N3/04 |
| 代理公司: | 北京德崇智捷知識產權代理有限公司 11467 | 代理人: | 申星宇 |
| 地址: | 100007 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 設備 能力 測算 方法 | ||
1.一種異構計算設備計算能力測算的方法,其特征在于,包括如下步驟,
步驟1、選取各類典型場景的深度學習模型集合S,芯片集合N,對于各類芯片統計時長和操作數;
步驟2、選取表中的兩列,針對推理所得數據,基于S,在坐標系中繪制相應的點;
步驟3、根據步驟2所得結果,獲得同一芯片不同精度間、不同芯片相同精度間計算能力的測算比例集合,總結出相應規律;
所述步驟1中,
對于過程中計算量的統計,應包含前向過程中的模型計算量和后向過程中的參數更新計算量;
所述步驟1中,
所述各類芯片包括不同款芯片、相同款芯片、多芯片;
所述步驟1中,
對于所述相同款芯片統計時長和操作數為,在同一芯片上,對同一模型在不同精度下統計時長和操作數;
所述n為芯片;
所述N為步驟1選取的芯片集合;
所述s為深度學習模型;
所述S為步驟1選取的深度學習模型集合;對于所述不同款芯片統計時長和操作數為,在不同模型、相同精度下統計時長和操作數;
所述步驟1中,
所述多芯片包括不同款芯片、相同款芯片,并將模型數量增大到S*以上,芯片款型增加到N*以上;
所述步驟1中,
對所述多芯片進行測算還包括以下步驟,
步驟1-1、按芯片種類進行如下編碼,以獲得全面的數據表,
對于定義元組
n=(t,id)
其中t為芯片種類,id為款型;
步驟1-2、將元組n與表中的任意一列數據作為輸入,另外任一列作為輸出,構建神經網絡;所述神經網絡可采用全連接或其他結構;所述其他結構由NAS過程篩選而得;所述神經網絡即可對新數據給出準確預測;
所述步驟1-1中,
所述芯片種類包括1-GPU,2-NPU;
所述規律為根據所得的結果繪圖,得到A、B兩種結果;
A結果為FLOPS@INT16與TOPS@INT8有穩定的測算關系;A結果應取包絡的質心的斜率作為比例;
B結果為無穩定的測算關系。
2.如權利要求1所述異構計算設備計算能力測算的方法,其特征在于,所述步驟1-2中,
所述網絡也可通過NAS尋找網絡結構;所述網絡結構應能以不小于67%的精度,將任意款型、任意精度的芯片的標稱算力,測算為其他任意款型、任意精度的芯片的標稱算力。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電子技術標準化研究院,未經中國電子技術標準化研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211320824.8/1.html,轉載請聲明來源鉆瓜專利網。





