[發明專利]一種可靈活配置的神經網絡計算單元、計算陣列及其構建方法有效
| 申請號: | 201811133940.2 | 申請日: | 2018-09-27 |
| 公開(公告)號: | CN109409512B | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 任鵬舉;樊瓏;趙博然;宗鵬陳;陳飛;鄭南寧 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 田洲 |
| 地址: | 710049 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 靈活 配置 神經網絡 計算 單元 陣列 及其 構建 方法 | ||
本發明公開一種可靈活配置的神經網絡計算單元、計算陣列及其構建方法,神經網絡計算單元包括:可配置存儲模塊、可配置控制模塊和可時分復用的乘加計算模塊;可配置存儲模塊包括:特征圖數據緩存buffer、步長數據緩存buffer和權值數據緩存buffer;可配置控制模塊包括:計數器模塊和狀態機模塊;乘加計算模塊包括:乘法器和累加器。本發明可支持任意類型的卷積計算,且支持多尺寸卷積核并行計算,充分發掘卷積神經網絡計算單元的靈活性和數據重用性,大幅降低由數據搬移帶來的系統功耗,提高系統的計算效率。
技術領域
本發明屬于神經網絡硬件架構領域,特別涉及一種可靈活配置的神經網絡計算單元、計算陣列及其構建方法。
背景技術
靈活的硬件計算架構對于卷積神經網絡的硬件實現具有著重要的影響。卷積層作為卷積神經網絡中最主要的結構,具有計算量大、數據可重用性強等特點。卷積層通過權值共享這一特征,降低了網絡模型的復雜度,極大地減少了參數的數量,避免了傳統識別算法中復雜的特征提取和數據重建過程。
在卷積神經網絡中,卷積層的主要作用為將同一組輸入特征圖數據與不同輸出通道的一組卷積核進行卷積,然后得到數量與輸出通道數目相同的輸出特征圖,完成對特征圖的特征提取。隨著卷積神經網絡被不斷地開發與學習且對神經網絡的需求逐漸增加,神經網絡模型的種類越來越多,網絡的深度也逐步加深,卷積層的卷積方式也變得復雜多變。
因此,靈活性強、計算性能高且可循環使用的神經網絡計算單元架構對于卷積層的硬件實現具有重大的意義。目前大多數卷積層計算單元的硬件實現都只能夠完成一種類型的卷積方式,不能夠支持網絡模型中具有不同類型卷積層的計算,且不能夠充分利用卷積層的數據重用性。
發明內容
本發明的目的在于提供一種可靈活配置的神經網絡計算單元、計算陣列及其構建方法,該方法可有效地增強卷積層在硬件實現時的靈活性,提高系統的計算效率,充分發揮卷積層的數據重用性,從而在一定程度上降低系統的功耗并減少存儲資源的使用。
為了實現上述的目的,本方案采用了如下的技術方案:
一種可靈活配置的神經網絡計算單元,包括:可配置存儲模塊、可配置控制模塊和可時分復用的乘加計算模塊;
可配置存儲模塊包括:特征圖數據緩存buffer、步長數據緩存buffer和權值數據緩存buffer;
可配置控制模塊包括:計數器模塊和狀態機模塊;
乘加計算模塊包括:乘法器和累加器。
進一步的,特征圖數據緩存buffer用于存儲卷積計算時用到的部分特征圖數據,并對存在數據共享的特征圖數據進行循環利用,其buffer的最大長度為L1,大小為max{K1A1,K2A2,…,KiAi},其中K為卷積層中卷積核的尺寸,A為計算單元內需映射的輸入通道數,i為目標網絡中卷積層的序號;
步長數據緩存buffer用于在卷積核滑動更新步長數據時向特征圖緩存buffer提供需要更新的數據,其buffer的最大長度為L2,大小為max{S1A1,S2A2,…,SiAi},其中S為卷積層中卷積核的步長;
權值數據緩存buffer用于存儲權值數據并能夠對數據進行重復利用,其長度為L3,大小為max{K1A1B1,K2A2B2,…,KiAiBi},其中B為計算單元內需映射的輸出通道數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811133940.2/2.html,轉載請聲明來源鉆瓜專利網。





