[發明專利]一種卷積神經網絡的剪枝方法、裝置、設備和介質有效
| 申請號: | 202110428305.2 | 申請日: | 2021-04-21 |
| 公開(公告)號: | CN113011588B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 張維緯;周密;余浩然 | 申請(專利權)人: | 華僑大學 |
| 主分類號: | G06N3/082 | 分類號: | G06N3/082;G06N3/0464 |
| 代理公司: | 泉州市文華專利代理有限公司 35205 | 代理人: | 陳雪瑩 |
| 地址: | 362000 福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 卷積 神經網絡 剪枝 方法 裝置 設備 介質 | ||
1.一種卷積神經網絡的剪枝方法,其特征在于:包括下述步驟:
S1、獲取圖像的數據集,并將數據集按比例分為訓練集與驗證集;
S2、將待剪枝的卷積神經網絡模型進行初始化后,對訓練集中的圖像進行多輪預訓練,從而獲得各網絡層的權重和,并根據權重和確定網絡的敏感層;
S3、通過強化學習進行多輪自動化剪枝操作,并通過驗證集驗證得到每輪剪枝操作的模型精確度,從而獲得模型精度最高的模型剪枝策略;其間,根據強化學習的確定性策略,對網絡的敏感層和非敏感層實行不同的壓縮策略,所述敏感層的壓縮率低于非敏感層的壓縮率,來對各網絡層的濾波器數量進行剪枝;所述步驟S3具體是:
S31、根據待剪枝的卷積神經網絡模型的濾波器總數和目標剪枝率確定濾波器待剪總量M,進入多輪自動化剪枝操作;
S32、獲取當前模型中的當前網絡層并判斷是否為敏感層,若否,按照強化學習給出的動作進行壓縮;若是,則根據強化學習的確定性策略,將強化學習的確定性輸出的當前層壓縮率設置為當前確定性輸出的0.1倍,獲取當前模型的當前網絡層i應當執行剪枝操作的濾波器數量Ni,同時計算獲得剩余濾波器待剪量M’,M’=M-∑Ni;
S33、通過計算濾波器的L2范數計算濾波器的重要性程度,并將重要性程度低的Ni個濾波器的權重設置為0,從而完成當前模型中的當前網絡層的Ni數量的濾波器剪枝;
S34、重復上述步驟S32和步驟S33,直到完成當前模型中的所有網絡層的自動化剪枝操作,則當前輪自動化剪枝操作結束;
S35、發起新的一輪自動化剪枝操作,回到步驟S32,直到完成所有輪次的自動化剪枝操作;
其中,在每輪自動化剪枝操作結束后,通過驗證集驗證得到當前模型剪枝操作的模型精確度,并將當前模型剪枝策略與模型精確度對應保存到強化學習經驗回放池中,在完成所有輪次的自動化剪枝操作后,通過比較即能獲取精確度最高的剪枝策略;
所述強化學習采用的是DDPG深度確定性策略強化學習法,該DDPG深度確定性策略強化學習法中的演員網絡與評論家網絡的訓練根據完整一輪自動化剪枝所獲得模型精確度與每一輪自動化剪枝中的剪枝狀態作為輸入來執行訓練操作;
其中,在狀態空間中,對于每一網絡層t,通過公式(1)所示的10個屬性來表示環境St的屬性特征:
(t,n,c,h,w,stride,k,FLOPs[t],Reall,Rest,at-1)??公式(1);
式(1)中,t表示卷積神經網絡模型層的索引,卷積核的尺寸為n×c×k×k,輸入值為c×h×w,Stride表示卷積操作中的步長,FLOPs[t]表示第Lt層的浮點計算次數,Reall表示前面所有已剪枝的網絡減少的FLOPs的總數,Rest表示余下各層中剩余的FLOPs總數;代理從濾波器剪枝的環境中獲得屬性特征所處的第t層的環境St,獲得當前特征向量,然后輸出環境St狀態下的動作作為當前網絡層的壓縮率at-1,指導當前網絡層進行可替代濾波器剪枝;
在下一輪剪枝時,通過在DDPG經驗回放池中采集m個樣本利用下述公式(2)計算當前目標Q值yj:
式(2)中,所示的πθ′(φ(S′j))是通過演員目標網絡獲得,而Q′(φ(S′j),πθ′(φ(S′j)),w′)則是通過評論家目標網絡獲得;其中γ的值設置為1以避免短期獎勵的優先級過高;在代理更新期間通過減去基線獎勵b來減少梯度估計的方差,is_endj則表示對當前是否處于模型最后一層的判斷;Rj表示的是強化學習函數當前所獲得的獎勵,其中梯度估計的值為此前獎勵的指數移動平均值;
對于強化學習中的當前目標Q值yj,通過在DDPG經驗回放池中采集m個樣本{φ(Sj),Aj,Rj,φ(S′j),is_endj},其中j=1,2,3…m,DDPG的損失函數為下述公式(3)所示的均方誤差函數:
式(3)中,φ(Sj)為當前狀態Sj下獲得的特征向量;其選擇出來的動作A會增加一定的噪聲,并且噪聲會在每輪剪枝完以后呈指數衰減,公式中Aj表示為當前強化學習輸出的動作,w則表示評論家當前網絡的參數,Q(φ(Sj),Aj,ω)由評論家當前網絡獲得;最終和環境交互的動作A如公式(3)和公式(4)所示,其中公式(4)中,S表示強化學習所獲得的當前狀態,e表示演員當前網絡的參數,N表示是對所獲得的動作添加的一定的噪聲:
A=πθ(S)+N????????????????公式(4);
強化學習中的獎勵函數如公式(5)所示,其中log(FLOPs)以e為底與Error成反比,其中Error表示模型錯誤率的百分比:
RFLOPs=-Error·log(FLOPs)??????????????公式(5);
所述步驟S33中的濾波器L2范數的計算采用下述公式(6)進行:
式(6)中,Fi,j表示的是第i層第j個濾波器,K表示濾波器的尺寸,N表示濾波器的個數,k1,k2表示濾波器參數矩陣的兩個維度;
S4、對完成多輪自動化剪枝操作后的卷積神經網絡模型執行微調操作,得到最終的卷積神經網絡模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華僑大學,未經華僑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110428305.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全自動眼鏡腳絲生產設備
- 下一篇:一種自動吸煙腹部鋪灸裝置





