[發明專利]一種卷積神經網絡的壓縮方法及其實現電路在審
| 申請號: | 202010624916.X | 申請日: | 2020-06-30 |
| 公開(公告)號: | CN111832705A | 公開(公告)日: | 2020-10-27 |
| 發明(設計)人: | 劉偉強;袁田;王成華 | 申請(專利權)人: | 南京航空航天大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 彭雄 |
| 地址: | 211106 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 卷積 神經網絡 壓縮 方法 及其 實現 電路 | ||
本發明提出一種卷積神經網絡的壓縮方法及其實現電路,該方法包括步驟:(1)將卷積神經網絡分為非剪枝層和剪枝層;(2)對整個卷積神經網絡進行剪枝,然后重新訓練,得到一個高精度的稀疏網絡;(3)移除非剪枝層的權重掩膜;(4)對剪枝層進行漸進量化;(5)保持剪枝層權重不變,對非剪枝層進行線性量化,得到壓縮后的卷積神經網絡。該壓縮方法能在保證高處理性能的情況下對卷積神經網絡模型進行大幅壓縮。針對此壓縮方法,本發明還提出一種卷積神經網絡的實現電路,包括:分布式非剪枝層硬件處理電路和剪枝層硬件處理電路,兩個電路以流水線的方式共同實現卷積神經網絡,以形成流水線的處理模式,大幅改善處理性能。
技術領域
本發明涉及深度學習加速器設計領域,具體涉及一種卷積神經網絡的壓縮方法及其實現電路。
背景技術
隨著卷積神經網絡在目標檢測及識別的快速發展,大幅改善圖像識別檢測精確度成為可能。然而,為了實現更好的目標檢測識別性能,卷積神經網絡在不斷地加深,帶來則是計算量的急速增長和模型大小的膨脹。因此,卷積神經網絡需要并行設備來對其進行加速,節省訓練時間或者滿足實時目標檢測的要求,例如大功耗的GPU設備等。為了實現深度卷積神經網絡在低功耗的嵌入式設備上的部署,基于FPGA的卷積神經網絡加速設計已經成為學術界和工業界研究的重點。
膨脹的深度神經網絡模型對存儲有著很高要求,為了節省存儲空間,神經網絡模型壓縮算法在近幾年不斷被提出。神經網絡剪枝,權重量化等壓縮算法由于其對精確度較小的影響,被廣泛使用在神經網絡模型壓縮中。然而大量研究表明,由于剪枝算法造成的模型不規則性,導致神經網絡并行計算效率低,對其處理速度造成了嚴重的影響。因此,需要一種適合硬件加速的壓縮策略,使卷積神經網絡在模型尺寸被大幅壓縮的情況下,仍然保持高性能的處理速度,同時滿足實時性檢測和小模型尺寸的要求。
發明內容
發明目的:大規模神經網絡模型尺寸龐大,存儲資源消耗巨大,難以在嵌入式設備上實現。然而壓縮后的神經網絡由于其模型的不規則性,在并行加速架構上計算效率低,計算速度慢,為了克服這個缺陷,本發明提出一種卷積神經網絡的壓縮方法及其實現電路。
技術方案:本發明提出的技術方案如下:
一種卷積神經網絡的壓縮方法,包括依次執行的步驟(1)至(5):
(1)將卷積神經網絡分為非剪枝層和剪枝層;
(2)對整個卷積神經網絡進行剪枝,然后重新訓練,得到一個高精度的稀疏網絡;
(3)移除非剪枝層的權重掩膜;
(4)對剪枝層進行漸進量化,具體步驟為:
1)隨機選取剪枝層中的一組權重進行量化;
2)重新訓練卷積神經網絡,更新剪枝層中其他組的權重和非剪枝層的權重,重復訓練過程,直至卷積神經網絡的精度滿足預設要求;
3)隨機選取剪枝層中的下一組權重進行量化,然后返回步驟3);
4)重復執行步驟2)至3),直至整個剪枝層量化完成;
(5)保持剪枝層權重不變,對非剪枝層進行線性量化,得到壓縮后的卷積神經網絡。
進一步的,所述步驟(2)中得到一個高精度的稀疏網絡的具體步驟為:
設置剪枝閾值,將卷積神經網絡中小于剪枝閾值的權重進行剪枝,然后重訓練卷積神經網絡,更新沒有被剪切的權重,重復訓練-剪枝過程,直至卷積神經網絡中所有權重都小于剪枝閾值,至此,得到一個高精度的稀疏網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京航空航天大學,未經南京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010624916.X/2.html,轉載請聲明來源鉆瓜專利網。





