[發明專利]卷積神經網絡的優化方法、裝置、存儲介質和系統在審
| 申請號: | 201811640762.2 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109726801A | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 北京中科寒武紀科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 北京華進京聯知識產權代理有限公司 11606 | 代理人: | 孫巖 |
| 地址: | 100190 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 存儲介質 神經網絡 優化 卷積計算 網絡網絡 冗余 卷積 刪除 融合 申請 | ||
1.一種卷積神經網絡優化方法,其特征在于,所述方法包括:
獲取第一配置參數及第二配置參數,其中,所述第一配置參數包括Batch Norm層的第一訓練參數及Batch Norm層的第二訓練參數;所述第二配置參數包括Scale層的第一訓練參數及Scale層的第二訓練參數;
將所述Batch Norm層的第一訓練參數以及所述Scale層的第一訓練參數與卷積層的權值參數融合,得到第一融合結果;
將所述Batch Norm層的第二訓練參數以及所述Scale層的第二訓練參數與卷積層的偏置參數融合,得到第二融合結果;
根據所述第一融合結果以及所述第二融合結果,對所述卷積神經網絡進行優化。
2.根據權利要求1所述的方法,其特征在于,所述將所述Batch Norm層的第一訓練參數以及所述Scale層的第一訓練參數與卷積層的權值參數融合,得到第一融合結果,包括:
將所述Batch Norm層的第一訓練參數、所述Scale層的第一訓練參數以及所述卷積層的權值參數進行乘法運算,得到所述第一融合結果。
3.根據權利要求1所述的方法,其特征在于,所述將所述Batch Norm層的第二訓練參數以及所述Scale層的第二訓練參數與卷積層的偏置參數融合,得到第二融合結果,包括:
將所述Batch Norm層的第二訓練參數、所述Scale層的第二訓練參數以及所述卷積層的偏置參數進行加法運算,得到所述第二融合結果。
4.根據權利要求1所述的方法,其特征在于,所述根據所述第一融合結果以及所述第二融合結果,對所述卷積神經網絡進行優化,包括:
刪除所述Batch Norm層以及所述Scale層,并將所述卷積層的權值參數更改為所述第一融合結果,將所述卷積層的偏置參數更改為所述第二融合結果。
5.根據權利要求1所述的方法,其特征在于,所述方法還包括:
將卷積層的輸入數據分別與所述第一融合結果和所述第二融合結果進行卷積計算,得到卷積層的輸出結果。
6.根據權利要求5所述的方法,其特征在于,所述將卷積層的輸入數據分別與所述第一融合結果和所述第二融合結果進行卷積計算,得到卷積層的輸出結果,包括:
將所述輸入數據與所述第一融合結果進行乘法運算,得到第一運算結果;
將所述第一運算結果與所述第二融合結果進行加法運算,得到所述輸出結果。
7.根據權利要求1所述的方法,其特征在于,所述Batch Norm層的第一訓練參數包括用于執行Batch Norm層的卷積計算的至少一個第一訓練子參數;所述Batch Norm層的第二訓練參數包括用于執行Batch Norm層的卷積計算的至少一個第二訓練子參數。
8.根據權利要求7所述的方法,其特征在于,
若所述Batch Norm層的第一訓練參數包括多個第一訓練子參數,則將所述多個第一訓練子參數進行運算,得到第一中間運算結果;
將所述第一中間運算結果以及所述Scale層的第一訓練參數與所述卷積層的權值參數融合,得到所述第一融合結果。
9.根據權利要求7所述的方法,其特征在于,
若所述Batch Norm層的第二訓練參數包括多個第二訓練子參數,則將所述多個第二訓練子參數進行運算,得到第二中間運算結果;
將所述第二中間運算結果以及所述Scale層的第二訓練參數與所述卷積層的偏置參數融合,得到所述第二融合結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中科寒武紀科技有限公司,未經北京中科寒武紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811640762.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:運算方法、裝置及相關產品
- 下一篇:一種鐵路和風電場環境風速機器學習預測方法





