[發(fā)明專利]通道全局排序指導剪枝和量化聯(lián)合的神經網絡壓縮方法在審
| 申請?zhí)枺?/td> | 202211217914.4 | 申請日: | 2022-09-30 |
| 公開(公告)號: | CN115661511A | 公開(公告)日: | 2023-01-31 |
| 發(fā)明(設計)人: | 謝衛(wèi)瑩;樊瀟怡;張鑫;李云松;雷杰 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/0495;G06N3/082 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通道 全局 排序 指導 剪枝 量化 聯(lián)合 神經網絡 壓縮 方法 | ||
1.一種通道全局排序指導剪枝和量化聯(lián)合的卷積神經網絡壓縮方法,其特征在于,包括如下步驟:
(1)獲取訓練樣本集和測試樣本集:
獲取包括M個目標類別且每個類別包含N幅RGB圖像的數據集X,并對每幅RGB圖像中的圖像類別進行標注,然后隨機選取數據集X中每類別包含的N0幅圖像,并將所選取的共MN0幅RGB圖像及其標簽組成訓練樣本集Xtrain,將剩余的M(N-N0)幅RGB圖像及其標簽組成測試樣本集Xtest,其中M≥10,N≥6000,N0≥0.8N;
(2)構建圖像分類卷積神經網絡模型O并對其進行迭代訓練:
構建包括順次連接的二維卷積層、批歸一化層、分段線性激活層、多個殘差單元模塊、自適應平均池化層、全連接層和softmax激活函數層的圖像分類卷積神經網絡模型O;第一殘差單元模塊包括順次連接的卷積模塊和分段線性激活層,且卷積模塊的輸入與分段線性激活層跳躍連接;第二殘差單元模塊包括并行排布的卷積模塊和平均池化層,以及與卷積模塊和平均池化層的輸出端連接的分段線性激活層;卷積模塊包括多個二維卷積層、多個批歸一化層和一個分段線性激活層;其中二維卷積層和分段線性激活層的總數均為L,L≥55,每個二維卷積層包括I個通道,I≥16;
(3)對圖像分類卷積神經網絡模型進行迭代訓練:
(3a)初始化迭代次數為e,最大迭代次數為E,E≥600,第e次迭代圖像分類卷積神經網絡模型的權值參數為θe,并令e=0;
(3b)將訓練樣本集Xtrain作為O的輸入,對每個訓練樣本進行特征提取,得到MN0個特征圖,并對每幅特征圖中的目標進行分類,得到每個訓練樣本的分類結果
(3c)采用交叉熵損失函數并通過每個訓練樣本的分類結果及其對應的標簽計算O的損失值再采用隨機梯度下降法,通過對權值參數θe的偏導值對θe進行更新,得到本次迭代的圖像分類卷積神經網絡模型Oe;
(3d)判斷e≥E是否成立,若是,得到訓練好的圖像分類卷積神經網絡模型否則,令e=e+1,Oe=O,并執(zhí)行步驟(3b);
(4)計算訓練好的圖像分類卷積神經網絡模型中所有通道的重要性得分并對圖像分類卷積神經網絡模型進行剪枝和量化:
(4a)將從訓練樣本集Xtrain中隨機選取的MN1個訓練樣本及其標簽組成的秩生成樣本集Xchoose作為的輸入,并使用鉤子Hook函數提取中輸入第c幅圖像時每個二維卷積層的每個通道的特征圖再對進行奇異值分解,得到輸入時每個通道的秩然后根據計算每個通道的平均秩后保存,其中,N1≥0.01N0,1≤l≤L,1≤i≤I;
(4b)通過每個通道的平均秩計算該通道的重要性得分并對訓練好的圖像分類卷積神經網絡模型中重要性得分最低的ρ個通道進行刪除,獲得剪枝率為Ω的剪枝后的圖像分類卷積神經網絡模型,其中,al、bl分別表示中可優(yōu)化的伸縮變量、偏移變量;
(4c)通過每個二維卷積層的I個通道組成的稀疏掩模計算該二維卷積層的稀疏性Sl=||Ψl||0,并根據Sl計算每個二維卷積層的權重量化位寬和每個分段線性激活層量化位寬
其中,表示通道被刪除,表示通道未刪除,||·||0表示L1范數,表示向上取整操作,是第l個二維卷積層的權重量化位寬上界,是第l個分段線性激活層所需的激活量化位寬上界,p表示懲罰因子;
(4d)根據每個二維卷積層的權重量化位寬和每個分段線性激活層量化位寬對剪枝后的圖像分類卷積神經網絡模型中每個二維卷積層的權重向量Wl進行量化,同時替換每個分段線性激活層的激活函數,得到量化后權重向量為分段線性激活層的激活函數為的剪枝量化后的圖像分類卷積神經網絡模型
(5)對剪枝量化后的圖像分類卷積神經網絡模型重新進行剪枝并更新權重、激活層量化位寬:
通過遺傳進化算法對中可優(yōu)化的伸縮變量al、偏移變量bl進行優(yōu)化,并通過al、bl的優(yōu)化結果al*、bl*和每個通道的平均秩重新計算每個通道的重要性得分,然后按重新計算的所有通道的重要性得分對剪枝量化后的圖像分類卷積神經網絡模型重新進行剪枝并更新的權重、激活層量化位寬,得到更新的剪枝量化后的圖像分類卷積神經網絡模型
(6)獲取圖像分類卷積神經網絡的壓縮結果:
對更新的剪枝量化后的圖像分類卷積神經網絡模型的權值參數進行微調,獲得壓縮后的圖像分類卷積神經網絡模型
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211217914.4/1.html,轉載請聲明來源鉆瓜專利網。





