[發明專利]卷積神經網絡剪枝優化方法、裝置、電子設備及存儲介質有效
| 申請號: | 202210217667.1 | 申請日: | 2022-03-08 |
| 公開(公告)號: | CN114330714B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 翟佳;何偉;董毅;陳峰;謝曉丹 | 申請(專利權)人: | 北京環境特性研究所 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 北京格允知識產權代理有限公司 11609 | 代理人: | 張莉瑜 |
| 地址: | 100854*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 神經網絡 剪枝 優化 方法 裝置 電子設備 存儲 介質 | ||
本發明提供了一種卷積神經網絡剪枝優化方法、裝置、電子設備及存儲介質,該方法包括:獲取完成訓練的卷積神經網絡模型;對于卷積神經網絡模型的每一個類別,確定對應的語義信息圖,并基于語義信息圖,確定每個濾波器在各類別中的濾波器重要性因子;根據濾波器重要性因子及剪枝目標,對濾波器進行重要程度排序;基于排序結果及剪枝目標,逐步剪除重要程度小的濾波器,直至達成剪枝目標,得到剪枝優化后的卷積神經網絡模型;對剪枝優化后的卷積神經網絡模型進行重訓練。本發明能夠實現有針對性的、效果更佳的卷積神經網絡剪枝壓縮。
技術領域
本發明實施例涉及深度學習技術領域,特別涉及一種卷積神經網絡剪枝優化方法、裝置、電子設備及存儲介質。
背景技術
卷積神經網絡在人工智能領域十分重要,常見的應用包括計算機視覺、語音識別和自然語言處理等。卷積神經網絡可通過加深網絡的層級結構來提高網絡性能。通過增長神經網絡模型的規模,可帶來學習任務效果的提升,但也帶來了卷積神經網絡部署困難。主要問題在于神經網絡模型內部參數存在巨大冗余,造成資源浪費。已有研究表明,只需要給定一小部分的參數子集,就能夠完整地重構出剩余參數,這證明了模型壓縮的可行性。
卷積神經網絡的剪枝優化是一種非常有效的模型壓縮方式,能夠移除在整個網絡中相對不重要的參數,而保留相對重要的參數,以控制模型壓縮的精度損失,并對模型進行加速。目前,現有的卷積神經網絡剪枝優化通常針對整體網絡的通用性場景展開,然而實際應用場景的多變性往往導致單純使用通用優化方法效果不佳。
發明內容
基于現有技術針對整體網絡的通用性場景展開卷積神經網絡剪枝優化效果不佳的問題,本發明實施例提供了一種有針對性的卷積神經網絡剪枝優化方法、裝置、電子設備及存儲介質,能夠結合類別實現卷積神經網絡定制優化。
第一方面,本發明實施例提供了一種卷積神經網絡剪枝優化方法,包括:
獲取完成訓練的卷積神經網絡模型,所述卷積神經網絡模型能夠對輸入的圖像進行分類識別;
對于所述卷積神經網絡模型的每一個類別,確定對應的語義信息圖,并基于所述語義信息圖,確定每個濾波器在各類別中的濾波器重要性因子;其中,一個類別對應的所述語義信息圖包含該類別相關的所有語義特征;
根據濾波器重要性因子及剪枝目標,對濾波器進行重要程度排序;其中,剪枝目標包括目標類別;
基于排序結果及剪枝目標,逐步剪除重要程度小的濾波器,直至達成剪枝目標,得到剪枝優化后的卷積神經網絡模型;
對剪枝優化后的卷積神經網絡模型進行重訓練。
可選地,所述對于所述卷積神經網絡模型的每一個類別,確定對應的語義信息圖,包括:
對每一個類別,構建多層的語義信息圖;其中,語義信息圖的層數與所述卷積神經網絡模型的層數相同,語義信息圖的每層包括多個節點,每個節點代表一個用于分類至該類別的語義特征;
根據各語義特征在訓練數據集上被激活的激活值,確定語義特征的重要性值。
可選地,所述根據各語義特征在訓練數據集上被激活的激活值,確定語義特征的重要性值,包括:
對于每一個語義特征,確定其在訓練數據集上被激活的所有激活值;
取數值最大的K個激活值求和,作為該語義特征的重要性值;其中,K小于訓練數據集的數據總量N。
可選地,基于所述語義信息圖,確定每個濾波器在各類別中的濾波器重要性因子,包括:
基于卷積神經網絡模型,確定各個卷積層中的濾波器;
對于每一個類別,基于所述語義信息圖,確定各濾波器能夠提取的語義特征及相應的重要性值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京環境特性研究所,未經北京環境特性研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210217667.1/2.html,轉載請聲明來源鉆瓜專利網。





