[發明專利]一種卷積模型輕量化方法及系統有效
| 申請號: | 202011615978.0 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112686382B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 吳博文;梁小丹;聶琳;林倞 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 陳旭紅;吳落 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 卷積 模型 量化 方法 系統 | ||
本發明提供一種卷積模型輕量化方法及系統,其中方法包括:獲取候選評估所述候選剪枝策略;其中,候選剪枝策略為卷積原模型中若干層級對應的剪枝率的集合;評估所述候選剪枝策略,獲得所述候選剪枝策略的評估結果;根據所述評估結果生成目標剪枝策略;評估目標剪枝策略在目標硬件上的性能,輸出最優剪枝策略;根據最優剪枝策略對所述卷積原模型進行剪枝操作,獲得輕量化卷積模型。本發明大大減少了現有卷積模型的參數量與計算量,為卷積模型提供了一種針對真實的硬件時延反饋的輕量化框架。
技術領域
本發明涉及神經網絡剪枝技術領域,特別是涉及一種卷積模型輕量化方法及系統。
背景技術
隨著深度學習理論和相關技術的蓬勃發展,有很多過去人們無法功課的問題都取得了巨大的進展,例如語音合成、語音識別等。特別是深度卷積神經網絡(“ImageNetClassification with Deep Convolutional Neural Networks”)的提出,讓計算機視覺的研究有了跨躍性的發展,人們通過深度卷積神經網絡在圖像分類、目標檢測和語義分割上取得了重大的進展。同時隨著GPU芯片的發展,人們可以使用的算力越來越大,神經網絡被構建的越來越深,參數越來越大,人們能夠利用神經網絡做的事情越來越多。但是巨大的參數量使得深度卷積模型在某些場景難以部署于實際的設備,比如在智能家居場景下,出于隱私保護和時延的考慮,各類模塊必須部署在端設備上,但是通常端設備的算力和存儲都十分有限,這給現有的深度學習技術帶來了獨特的技術挑戰。
發明內容
本發明提供一種卷積模型輕量化方法及系統,克服現有卷積模型參數量大、計算量大,難以在端設備上部署的問題。
本發明一個實施例提供一種卷積模型輕量化方法,包括:
獲取候選評估所述候選剪枝策略;其中,候選剪枝策略為卷積原模型中若干層級對應的剪枝率的集合;
評估所述候選剪枝策略,獲得所述候選剪枝策略的評估結果;
根據所述評估結果生成目標剪枝策略;
評估目標剪枝策略在目標硬件上的性能,輸出最優剪枝策略;
根據最優剪枝策略對所述卷積原模型進行剪枝操作,獲得輕量化卷積模型。
進一步地,所述評估所述候選剪枝策略,包括:基于短期微調的評估,具體地:
根據所述候選剪枝策略對所述卷積原模型進行剪枝操作,獲得卷積剪枝模型;
通過驗證集評估所述卷積剪枝模型,得到驗證集準確率及損失函數數值;其中,所述驗證集準確率及損失函數數值作為所述候選剪枝策略的評估結果。
進一步地,所述評估所述候選剪枝策略,包括:基于更新批規范化層的評估,具體地:
根據所述候選剪枝策略對所述卷積原模型進行剪枝操作,獲得第一卷積剪枝模型;
通過訓練集對所述卷積剪枝模型進行推理,得到特征值;
根據所述特征值更新批規范化層的統計量,得到滑動平均值以及滑動方差;
通過滑動平均值以及滑動方差更新所述第一卷積剪枝模型,生成第二卷積剪枝模型;
通過驗證集評估所述第二卷積剪枝模型,得到驗證集準確率及損失函數數值;其中,所述驗證集準確率及損失函數數值作為所述候選剪枝策略的評估結果。
進一步地,所述獲取候選剪枝策略,包括:候選剪枝策略隨機搜索,具體地:
根據搜索空間生成待候選剪枝策略;
通過硬件性能反饋模塊對所述待候選剪枝策略進行評估;
若所述待候選剪枝策略不滿足預設硬件性能約束條件,則再次根據搜索空間生成另一個待候選剪枝策略;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011615978.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自動化燙金裝置
- 下一篇:一種油芯分離式結構的電子煙





