[發明專利]專用神經網絡加速器的池化與向量運算的一致性變換方法在審
| 申請號: | 202010462690.8 | 申請日: | 2020-05-27 |
| 公開(公告)號: | CN111667062A | 公開(公告)日: | 2020-09-15 |
| 發明(設計)人: | 王維;伍駿 | 申請(專利權)人: | 上海賽昉科技有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04 |
| 代理公司: | 上海創開專利代理事務所(普通合伙) 31374 | 代理人: | 吳海燕 |
| 地址: | 200120 上海市浦東新區中國(上海)自由貿易試*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 專用 神經網絡 加速器 向量 運算 一致性 變換 方法 | ||
本發明公開了專用神經網絡加速器的池化與向量運算的一致性變換方法,涉及神經網絡技術領域。本發明的變換方法基于硬件處理流程包括如下步驟:S01、判斷當前網絡層:若為池化層,則根據步長及填充值數量,在輸入特征圖中選擇多組一維特征向量,并設置權重系數不參與運算,作為池化濾波器;若為按元素計算層,則在兩幅輸入特征圖中選擇相同數量的一維特征向量,并將其中一幅特征圖中特征向量作為權重系數傳入處理矩陣;S02、處理矩陣并行處理多組轉化后的一維池化或向量運算,得到多組計算結果;S03、輸出結果。本發明不影響算法運算邏輯,方便統一處理兩類網絡層運算;減少硬件資源消耗、降低功耗的同時,也降低了硬件資源閑置可能性。
技術領域
本發明屬于神經網絡技術領域,特別是涉及專用神經網絡加速器的池化與向量運算的一致性變換方法。
背景技術
池化層(pooling)與按元素計算層(element-wise)是深度神經網絡中常見的網絡層,在現有的一些專用神經網絡加速器中對這兩種網絡運算的加速一般采用直接映射的方式,即設計具有特定功能的專用處理電路分別對池化層及按元素計算層運算進行硬件加速。對以低功耗設計為目標的加速器設計,這種直接映射的硬件設計顯然不夠優化。
對于采用直接映射方式對池化及向量運算加速的專用加速器,雖然保證了運算效率,但造成更多的硬件資源浪費和功耗,此外,若通過專用加速器運行的深度神經網絡不包含上述網絡層的一種或全部,將進一步造成硬件資源的閑置浪費和功耗輸出。
本發明要解決的技術問題是提出了一種適用于專用神經網絡加速器的池化與向量(包括按元素計算)的一致性變換方法,解決這兩類網絡層低功耗結構設計的問題。
發明內容
本發明提供了專用神經網絡加速器的池化與向量運算的一致性變換方法,解決了以上問題。
為解決上述技術問題,本發明是通過以下技術方案實現的:
本發明的專用神經網絡加速器的池化與向量運算的一致性變換方法,所述專用神經網絡加速器內部是由處理單元(PE)構成的二維結構,處理單元內部包含如乘法器、加法器、比較器的基本運算器件,處理單元用于特征點與權重系數的計算,對處理單元進一步分組可并行處理多組一維向量運算,所述變換方法基于硬件處理流程包括如下步驟:
S01、判斷當前網絡層:若為池化層,則根據步長及填充值數量,在輸入特征圖中選擇多組一維特征向量,并設置權重系數不參與運算,作為池化濾波器;若為按元素計算層,則在兩幅輸入特征圖中選擇相同數量的一維特征向量,并將其中一幅特征圖中的特征向量作為權重系數傳入處理矩陣;
S02、處理矩陣并行處理多組轉化后的一維池化或向量運算,并得到多組計算結果;
S03、并行輸出處理矩陣計算得到的一維池化或向量計算結果。
本發明相對于現有技術包括有以下有益效果:
1、本發明通過對池化層與按元素計算層運算邏輯的分析,提出一種一致性變換方法,通過這種一致性變換方法能夠將池化與按元素計算統一轉換為一維向量運算,而不影響算法運算邏輯,方便統一處理兩類網絡層運算。
2、通過本發明提出的一致性變換方法,兩類網絡層的運算轉變為同類運算,方便復用相同的專用處理電路對兩類網絡層運算加速,減少硬件資源消耗、降低功耗的同時,也降低了硬件資源閑置可能性;甚至可以直接復用普遍存在于專用神經網絡加速器中的通用矩陣乘(GEMM)器件,進一步減少硬件資源消耗,降低功率消耗。
當然,實施本發明的任一產品并不一定需要同時達到以上所述的所有優點。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海賽昉科技有限公司,未經上海賽昉科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010462690.8/2.html,轉載請聲明來源鉆瓜專利網。





