[發明專利]一種向量化計算的深度卷積計算方法及裝置有效
| 申請號: | 202010144274.3 | 申請日: | 2020-03-04 |
| 公開(公告)號: | CN111340208B | 公開(公告)日: | 2023-05-23 |
| 發明(設計)人: | 張銳;黃明飛;王海濤 | 申請(專利權)人: | 開放智能機器(上海)有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06F17/15;G06F17/16 |
| 代理公司: | 上海申新律師事務所 31272 | 代理人: | 吳軼淳 |
| 地址: | 200233 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 量化 計算 深度 卷積 計算方法 裝置 | ||
本發明發明了一種向量化計算的深度卷積計算方法及裝置,基于Arm?CPU的Neon指令針對Depthwise卷積的計算進行了優化,根據一個寄存器能夠存儲四個浮點數據,能夠一次性得到卷積數值,并且每一次將保存臨時數據與上一次向量相加,提高了Depthwise卷積的計算性能,從而提升了包含Depthwise卷積網絡的性能。
技術領域
本發明涉及一種機器視覺領域技術領域,尤其涉及一種向量化計算的深度卷積計算方法及裝置。
背景技術
近些年隨著AI技術的發展,各種各樣的深度學習網絡結構被提出來。為了能夠讓網絡可以在嵌入式平臺高性能的運行,新的OP操作也在不斷涌現出來,這其中包括MobileNet網絡中Depthwise卷積操作。
請參閱圖1-3,圖1-3描述了現有的卷積操作方案。首先輸入待卷積的卷積層c0~c2,根據卷積核和卷積層的映射關系,用對應的卷積核權重去卷積輸入的帶卷積層數據得到映射結果。具體的,如圖2-3,以3×3的卷積核尺寸為例,第一行的卷積核的權重分別為w0、w1和w2,第二行的卷積核權重分別為w3、w4和w5,第三行的卷積核權重為w6、w7和w9。每一層輸入的待卷積層的i00~i02、i10~i12和i20~i22與卷積核權重w0~w8乘積之和得到Outputdata即O00,i01~i03、i11~i13和i21~i23與卷積核權重w0~w8乘積之和得到Outputdata即O01。每一次計算得到一個輸入數據,計算所有之后。
由此可以看出,每一次輸入數據只能得到一個數值,而且下一次輸入的待卷積數據與上一次輸入的待卷積數據存在不連續的情況。因此影響已有Depthwise卷積計算性能的主要因素為(1)數據的讀取是否能夠連續(2)從內存中讀取的數據,能否被多次利用(3)能否在同樣的時間計算出更多的輸出數據。
發明內容
為解決現有技術中存在的問題,綜合以上幾點因素,本發明提供了一種一種基于向量化計算的Depthwise卷積計算方法及裝置,具體方案如下。
一種基于向量化計算的深度卷積計算方法,其特征在于,具有如下操作步驟:
步驟S1,第一寄存器矩陣讀取呈行列式分布的一組待卷積數據,每一行第一寄存器依序讀取對應一行的所述一組待卷積數據,每一個第一寄存器存儲四個待卷積數據;一第二寄存器矩陣讀取呈行列式分布的卷積核的權重值,每一行第二寄存器依序讀取對應一行的所述卷積核的權重值,每一個第二寄存器存儲四個相同的權重值;其中,所述第二寄存器矩陣的列和所述卷積核的列一一對應;
步驟S2,將所述第一寄存器矩陣的第一列第一寄存器讀取的待卷積數據與所述第二寄存器矩陣的第一列第二寄存器讀取的權重值進行矢量乘累加,將得到當前的一組結果數據存入一第三寄存器中;
步驟S3,對所述步驟S2的循環次數進行判斷,若循環次數已經達到所述卷積核的寬,則繼續步驟S5,否則繼續步驟S4;
步驟S4,將每一行所述一組待卷積數據在對應行的所述第一寄存器中進行由右至左的移位操作;將每一列的所述第二寄存器讀取的權重值依次更新為下一列所述第二寄存器讀取的權重值,繼續執行步驟S2;
步驟S5,將一組卷積后的數據輸出到內存中。
進一步的,其特征在于,在所屬步驟S1之前還包括步驟S0:依次選取一組待卷積數據,其中,選取的所述一組待卷積數據行數和所述卷積核的高相同;選取的所述一組待卷積數據的列數等于所述卷積核的寬+3。
進一步的,其特征在于,所述步驟2具有如下步驟:
步驟S21,將所述第一寄存器矩陣的第一列第一寄存器中存儲的所述待卷積數據與所述第二寄存器矩陣的第一列第二寄存器中存儲的權重值做矢量乘積,得到當前的第一臨時數據;
步驟S22,將所述第一臨時數據按照所述卷積核的高的方向進行向量相加得到當前的第二臨時數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于開放智能機器(上海)有限公司,未經開放智能機器(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010144274.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:儲能電路、時鐘記憶電路及空調機組
- 下一篇:一種勻化倍頻光光場分布的裝置





