[發明專利]一種神經網絡裁剪方法、裝置、設備及存儲介質在審
| 申請號: | 202111305290.7 | 申請日: | 2021-11-05 |
| 公開(公告)號: | CN113962387A | 公開(公告)日: | 2022-01-21 |
| 發明(設計)人: | 郭智豪;常歡;吳嘉嘉;謝名亮;殷兵 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 付麗 |
| 地址: | 230088 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 裁剪 方法 裝置 設備 存儲 介質 | ||
本申請提供了一種神經網絡裁剪方法、裝置、設備及存儲介質,其中,方法包括:確定待裁剪神經網絡中待裁剪卷積核的卷積核參數間的相關性;根據待裁剪卷積核的卷積核參數間的相關性,確定待裁剪卷積核對應的裁剪掩模;根據待裁剪卷積核對應的裁剪掩模,對待裁剪卷積核的卷積核參數進行裁剪。由于本申請提供的裁剪方法不會破壞原有的神經網絡的網絡參數的結構化信息,因此,通過本申請提供的裁剪方法裁剪得到的神經網絡能夠部署到大多數硬件平臺中,而不需要額外專門的硬件去支持,另外,本申請根據待裁剪卷積核對應的裁剪掩模,對待裁剪卷積核的卷積核參數進行裁剪,而非直接將整個卷積核或者整個通道裁減掉,實現了神經網絡的精細化裁剪。
技術領域
本申請涉及網絡裁剪技術領域,尤其涉及一種神經網絡裁剪方法、裝置、設備及存儲介質。
背景技術
近年來,深度學習技術在圖像識別、語音識別、自然語言處理等領域取得了顯著的效果。然而,由于深度神經網絡巨大的參數量,使得其在很多場景下很難落地使用,比如,嵌入式系統、手機端。為了解決該問題,目前比較流行的方法有網絡模型搜索、網絡模型量化、網絡模型裁剪,其中,網絡模型裁剪因為簡單、可靠、成熟等優點而被大量使用。
目前的網絡模型裁剪主要為權重裁剪,權重裁剪是一種精細化的裁剪方式,其將網絡參數中值趨近于0的獨立參數裁剪掉,這種方法可以最大限度的裁剪神經網絡參數,但是,由于裁剪的參數是隨機的,使得網絡參數分布不具有結構化信息,導致大多數硬件平臺難以支持通過該方法裁剪的網絡。
發明內容
有鑒于此,本申請提供了一種神經網絡裁剪方法、裝置、設備及存儲介質,用以解決現有的神經網絡裁剪方法破壞了原有的神經網絡的網絡參數的結構,導致大多數硬件平臺難以支持裁剪后的網絡的問題,其技術方案如下:
一種神經網絡裁剪方法,包括:
確定待裁剪神經網絡中待裁剪卷積核的卷積核參數間的相關性;
根據所述待裁剪卷積核的卷積核參數間的相關性,確定所述待裁剪卷積核對應的裁剪掩模;
根據所述待裁剪卷積核對應的裁剪掩模,對所述待裁剪卷積核的卷積核參數進行裁剪。
可選的,所述確定待裁剪神經網絡中待裁剪卷積核的參數間的相關性,包括:
通過對所述待裁剪卷積核的卷積核參數進行處理,確定所述待裁剪卷積核對應的自注意力矩陣,其中,所述待裁剪卷積核對應的自注意力矩陣能夠表征所述待裁剪卷積核的卷積核參數間的相關性。
可選的,所述通過對所述待裁剪卷積核的卷積核參數進行處理,確定所述待裁剪卷積核對應的自注意力矩陣,包括:
將所述待裁剪卷積核處理成二維矩陣,其中,所述二維矩陣的行數為所述待裁剪卷積核的通道數,所述二維矩陣的每一行為所述待裁剪卷積核的一個通道的卷積核參數;
對所述二維矩陣進行轉置,以得到所述二維矩陣的轉置矩陣;
用所述二維矩陣右乘所述二維矩陣的轉置矩陣,得到的矩陣作為所述待裁剪卷積核對應的自注意力矩陣。
可選的,所述根據所述待裁剪卷積核的卷積核參數間的相關性,確定所述待裁剪卷積核對應的裁剪掩模,包括:
將所述裁剪卷積核對應的自注意力矩陣處理成與所述待裁剪卷積核尺寸相同、且每個元素的取值均在預設范圍內的矩陣,作為所述待裁剪卷積核對應的裁剪掩模。
可選的,所述將所述裁剪卷積核對應的自注意力矩陣處理成與所述待裁剪卷積核尺寸相同、且每個元素的取值均在預設范圍內的矩陣,作為所述待裁剪卷積核對應的裁剪掩模,包括:
對所述待裁剪卷積核對應的自注意力矩陣,以列為單位進行歸一化處理,得到的矩陣作為第一歸一化矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111305290.7/2.html,轉載請聲明來源鉆瓜專利網。





