[發明專利]神經網絡壓縮的方法、數據處理的方法及相關裝置在審
| 申請號: | 202010105175.4 | 申請日: | 2020-02-20 |
| 公開(公告)號: | CN111382867A | 公開(公告)日: | 2020-07-07 |
| 發明(設計)人: | 舒晗;陳漢亭;王云鶴;許春景 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06N3/04;G06F17/14 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 王龍華;章愫 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 壓縮 方法 數據處理 相關 裝置 | ||
1.一種神經網絡壓縮的方法,其特征在于,包括:
對待壓縮的三維卷積神經網絡包括的第一三維卷積核執行以下操作:
在所述第一三維卷積核的時間維度上對所述第一三維卷積核進行正交變換;
根據正交變換后的所述第一三維卷積核在時間維度上的稀疏性,對所述第一三維卷積核的時間維度進行剪枝,得到壓縮后的三維卷積神經網絡。
2.根據權利要求1所述的方法,其特征在于,所述在第一三維卷積核的時間維度上對所述第一三維卷積核進行正交變換,包括:
采用正交矩陣,在所述第一三維卷積核的時間維度上對所述第一三維卷積核進行正交變換,所述正交矩陣是通過目標優化函數學習得到的,所述目標優化函數包括第一項與第二項,所述第一項使得所述正交變換可逆,所述第二項使得所述正交變換后的所述第一三維卷積核在時間維度是稀疏的。
3.根據權利要求2所述的方法,其特征在于,所述目標優化函數為:
s.t.STS=I
其中,X表示所述待壓縮的三維卷積神經網絡的輸入數據對應的矩陣,T表示矩陣的轉置,F表示所述第一三維卷積核對應的矩陣,Y表示所述待壓縮的三維卷積神經網絡的輸出數據對應的矩陣,所述第一三維卷積核的大小為d2t,d表示所述第一三維卷積核的高度與寬度,t表示所述第一三維卷積核的時間維度,fi表示t維向量,c表示所述第一三維卷積核的輸入通道,S表示所述正交矩陣,λ為常數,表示F范數|| ||F的平方,|| ||2,1表示L21范數,
其中,為所述目標優化函數的第一項,為所述目標優化函數的第二項。
4.根據權利要求2所述的方法,其特征在于,所述目標優化函數還包括第三項,所述第三項為所述第一三維卷積核的通道的函數的一范數。
5.根據權利要求4所述的方法,其特征在于,所述目標優化函數為:
s.t.STS=I
其中,X表示所述待壓縮的三維卷積神經網絡的輸入數據對應的矩陣,T表示矩陣的轉置,F表示所述第一三維卷積核對應的矩陣,Y表示所述待壓縮的三維卷積神經網絡的輸出數據對應的矩陣,所述第一三維卷積核的大小為d2t,d表示所述第一三維卷積核的高度與寬度,t表示所述第一三維卷積核的時間維度,fi表示t維向量,c表示所述第一三維卷積核的輸入通道,S表示所述正交矩陣,β表示所述第一三維卷積核的通道的函數,γ與λ為常數,表示F范數|| ||F的平方,|| ||1表示一范數,|| ||2,1表示L21范數,
其中,為所述目標優化函數的第一項,為所述目標優化函數的第二項,γ||β||1為所述目標優化函數的第三項。
6.根據權利要求1至5中任一項所述的方法,其特征在于,所述根據正交變換后的所述第一三維卷積核在時間維度上的稀疏性,對所述第一三維卷積核的時間維度進行剪枝,包括:
根據正交變換后的所述第一三維卷積核的L21范數,獲取正交變換后的所述第一三維卷積核在時間維度上的稀疏性;
根據所述稀疏性,對所述第一三維卷積核的時間維度進行剪枝。
7.一種數據處理的方法,其特征在于,包括:
將待處理的三維圖像數據輸入壓縮后的三維卷積神經網絡;
利用所述壓縮后的三維卷積神經網絡對所述三維圖像數據進行處理,獲得所述三維圖像數據的處理結果;
其中,所述壓縮后的三維卷積神經網絡是進行如下操作得到的:
在待壓縮的三維卷積神經網絡包括的第一三維卷積核的時間維度上對所述第一三維卷積核進行正交變換;
根據正交變換后的所述第一三維卷積核在時間維度上的稀疏性,對所述第一三維卷積核的時間維度進行剪枝。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010105175.4/1.html,轉載請聲明來源鉆瓜專利網。





