[發明專利]敏感度分析和強化學習的神經網絡剪枝方法、系統及裝置在審
| 申請號: | 202011056171.8 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112183746A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 陳海波;關翔 | 申請(專利權)人: | 深蘭人工智能(深圳)有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06N3/063 |
| 代理公司: | 常州佰業騰飛專利代理事務所(普通合伙) 32231 | 代理人: | 陳紅橋 |
| 地址: | 518131 廣東省深圳市龍華*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 敏感度 分析 強化 學習 神經網絡 剪枝 方法 系統 裝置 | ||
本發明公開了一種敏感度分析和強化學習的神經網絡剪枝方法、系統及裝置,包括:設定稀疏度閾值步驟,選擇低敏感度的權重進行剪枝;獲取裁剪辦法和精度步驟,根據上述的敏感度權重確定需要進行隨機剪枝的權重;對被選定的每一個權重進行隨機裁剪,將多次隨機裁剪的剪枝辦法和精度放入緩沖區;訓練強化學習步驟,利用緩沖區中的數據訓練強化學習代理,訓練后生成的裁剪辦法和精度放入緩沖區;重復進行,直到網絡精度達到預設值。本發明選擇低敏感度的權重進行剪枝,設定各權重的稀疏度閾值保證被裁剪的權重采用當前稀疏度進程裁剪后,網絡下降的精度保持在預設范圍以內。在保證網絡精度的情況下,最大化的提升了神經網絡的壓縮率。
技術領域
本申請涉及深度學習壓縮技術領域,具體而言,涉及一種基于敏感度分析和強化學習的神經網絡剪枝方法。
背景技術
剪枝(prune)是卷積神經網絡(CNN)的一種壓縮技術,它主要用來減少卷積神經網絡(CNN)計算量。剪枝算法通常情況下是通過裁剪掉神經網絡權重(weight)中不重要的張量(tensor)來達到降低整個神經網絡的計算量的目的。
神經網絡權重(weight)中哪些張量(tensor)不重要是由其稀疏度(sparsity)判定的。稀疏度(sparsity)用來衡量張量(tensor)中0的個數與張量的大小來表示。所以裁剪掉權重(weight)中稀疏度(sparsity)較高的張量(tensor),就可以達到壓縮卷積神經網絡(CNN)的目的。
卷積神經網絡(CNN)壓縮的準則是在減少計算量的同時保證網路的精度。文獻1中提到了一種敏感度分析(sensitivity analyse)解決了裁剪掉權重(weight)中稀疏度大于多少的張量(tensor)的問題。就是先獨立的裁剪掉每個權重的tensor,然后再通過數據驗證集來檢測網絡的精度。通過這種方法可以分析出每個權重的敏感度,用以確認該裁剪掉當前權重的多少張量(tensor)。基于敏感度分析(sensitivity analyse)的剪枝辦法,主要針對的是獨立的權重,并沒有考慮到不同權重之間的相關性,所以往往并不能取得較好的壓縮效率。
基于強化學習的神經網絡剪枝是一種自動化的剪枝技術,可以自動分析出神經網絡權重(weight)的稀疏度(sparsity),然后做出合理的決策對網路進行剪枝,并且在多數情況下被剪枝的網絡的網絡精度和壓縮率都比較好。
這種基于強化學習的神經網絡剪枝分為三步:隨機對神經網絡的多個權重(權重)進行隨機裁剪,然后對裁剪后的網絡進行微調(fine tuning)記錄網絡的精度。然后把裁剪辦法和裁剪后神經網絡的精度一起記錄下來放入數據緩沖區。第一步重復n次,在緩沖區積累一定數據后,則進行第二步利用數據緩沖區中的數據訓練強化學習代理(agent),并利用第二步訓練的代理(agent),預測具體的裁剪動作,利用該方法對網絡進行剪枝,對第二步剪枝后的網絡,進行微調(fine tuning),記錄下微調(fine tuning)后的網絡精度,將第二步預測得到的裁剪動作和第三步微調(fine tuning)后的網絡精度放入緩沖區。然后跳到第二步。當第三步微調(fine tuning)后的網絡精度達到預期,則停止循環?;趶娀瘜W習的方法,就是要教會網絡采用什么樣的辦法對網絡進行裁剪,才能夠得到高的回報(網絡精度)。這就需要訓練代理(agent)的數據夠好,包含的信息夠全。但是在上面提到的第一步經過隨機的對多個權重(weight)進行裁剪后,有時所獲得的網絡精度并不理想,利用這些“不好”的數據很難訓練出有效的代理(agent),或者使訓練代理(agent)的時間增加。基于強化學習的剪枝辦法,雖然考慮單個權重(weight)和多個權重(weight)裁剪對網絡精度的影響。但有時候因為無法得到有效的數據,無法訓練出比較好的代理(agent),這些不好的代理(agent),往往無法產生好的剪枝辦法。
發明內容
1、本發明的目的
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深蘭人工智能(深圳)有限公司,未經深蘭人工智能(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011056171.8/2.html,轉載請聲明來源鉆瓜專利網。





