[發明專利]基于硬件環境的卷積計算仿真測試方法、裝置及相關設備有效
| 申請號: | 201910760181.0 | 申請日: | 2019-08-16 |
| 公開(公告)號: | CN110516334B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 曹其春;趙雅倩;董剛;范寶余;梁玲燕 | 申請(專利權)人: | 浪潮電子信息產業股份有限公司 |
| 主分類號: | G06F30/331 | 分類號: | G06F30/331;G06F30/34 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 劉翠香 |
| 地址: | 250101 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 硬件 環境 卷積 計算 仿真 測試 方法 裝置 相關 設備 | ||
1.一種基于硬件環境的卷積計算仿真測試方法,其特征在于,包括:
獲取待用于進行卷積計算的數據信息,所述數據信息至少包括輸入特征圖和權重;
模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據;
將所述第一結果數據與第二結果數據進行比對,獲得第一比對結果,所述第二結果數據為在所述硬件環境下使用所述數據信息進行卷積計算獲得的數據;
根據所述第一比對結果,驗證硬件實現邏輯是否正確;
其中,所述數據信息為32位浮點數類型,在所述獲取待用于進行卷積計算的數據信息之后、所述模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據之前,還包括:
將所述數據信息由32位浮點數類型量化為8位整數類型;
在所述模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據之后,還包括:
將所述第一結果數據反量化到32位浮點數類型,獲得第一對應結果;
將所述第一對應結果與第二對應結果進行比對,獲得第二比對結果,所述第二對應結果為:使用理論卷積計算邏輯,基于32位浮點數類型的所述數據信息進行卷積計算,獲得的結果;
根據所述第二比對結果,確定精度損失是否滿足預設要求;
在所述精度損失不滿足預設要求的情況下,對所述數據信息進行調整。
2.根據權利要求1所述的方法,其特征在于,還包括:
根據所述第一比對結果,定位并輸出硬件實現邏輯的錯誤位置。
3.根據權利要求1至2之中任一項所述的方法,其特征在于,所述權重為7x7卷積核,所述模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據,包括:
將所述7x7卷積核轉換為9x9卷積核,并將所述9x9卷積核平分成9個3x3卷積核;
將所述輸入特征圖按照卷積核拆分的偏移位置拆分成9個特征圖;
對9個特征圖中的每個特征圖與對應的3x3卷積核進行卷積計算,將得到的特征圖進行累加得到一個通道的特征圖;
在輸入通道上進行累加得到輸出通道上的特征圖數據,獲得第一結果數據。
4.根據權利要求1至2之中任一項所述的方法,其特征在于,所述權重為3x3卷積核,所述模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據,包括:
將所述輸入特征圖依次取出11x11區域,后11x11區域與前11x11區域有2列或2行的重疊;
將每個11x11區域拆分成9個5x5區域,后5x5區域與前5x5區域之間有2行或2列的重疊;
將每個5x5區域進行數據重排序為9x9矩陣,同時將所述3x3卷積核數據重排序為9x9矩陣;
經過脈動陣列使對應兩個9x9矩陣的列相乘累加得出9個數,排成3x3區域,組合得到輸出特征圖,獲得第一結果數據。
5.根據權利要求1至2之中任一項所述的方法,其特征在于,所述權重為1x1卷積核,所述模擬硬件環境的卷積計算實現邏輯,基于所述數據信息進行卷積計算的軟件仿真,獲得第一結果數據,包括:
將所述輸入特征圖依次取出9x9矩陣,并將所述1x1卷積核數據重排序為9x9矩陣;
經過脈動陣列使對應兩個9x9矩陣相乘得出9x9區域,組合得到輸出特征圖,獲得第一結果數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮電子信息產業股份有限公司,未經浪潮電子信息產業股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910760181.0/1.html,轉載請聲明來源鉆瓜專利網。





