[發明專利]卷積神經網絡的快速計算在審
| 申請號: | 201880017855.1 | 申請日: | 2018-10-24 |
| 公開(公告)號: | CN110537193A | 公開(公告)日: | 2019-12-03 |
| 發明(設計)人: | 劉永超;黃啟印;潘國振;李思仲;徐建國;章海濤;王琳 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04;G06N3/08 |
| 代理公司: | 11415 北京博思佳知識產權代理有限公司 | 代理人: | 艾佳<國際申請>=PCT/CN2018/ |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 卷積神經網絡 濾波器參數 預先計算 可重用 濾波器 計算機實現 輸出數據 輸出 運算符 網絡 | ||
1.一種計算機實現的方法,包括:
數據處理裝置獲得包括一個或多個卷積層的經訓練的卷積神經網絡,所述一個或多個卷積層各自包括具有已知濾波器參數的多個濾波器;
所述數據處理裝置基于所述經訓練的卷積神經網絡的所述已知濾波器參數,預先計算所述一個或多個卷積層各自的可重用因子;
所述數據處理裝置接收所述經訓練的卷積神經網絡的輸入數據;
所述數據處理裝置基于所述預先計算的可重用因子和所述輸入數據,使用Winograd卷積運算符來計算所述一個或多個卷積層各自的輸出;以及
所述數據處理裝置基于所述一個或多個卷積層各自的所述輸出,確定所述經訓練的卷積網絡的輸出數據。
2.如權利要求1所述的計算機實現的方法,其中,基于所述經訓練的卷積神經網絡的所述已知濾波器參數,預先計算所述一個或多個卷積層各自的所述可重用因子,包括:
基于所述經訓練的卷積神經網絡的所述已知濾波器參數,離線計算所述一個或多個卷積層各自的所述可重用因子,而不管所述經訓練的卷積神經網絡的所述輸入數據如何。
3.如權利要求1所述的計算機實現的方法,還包括:
保存所述一個或多個卷積層各自的所述預先計算的可重用因子。
4.如權利要求1所述的計算機實現的方法,其中,基于所述預先計算的可重用因子和所述輸入數據,計算所述一個或多個卷積層各自的輸出,包括:
使用所述預先計算的可重用因子和所述輸入數據,根據Winograd最小濾波算法來計算所述一個或多個卷積層各自的輸出。
5.如權利要求1所述的計算機實現的方法,其中,所述經訓練的卷積神經網絡的所述輸入數據包括一個或多個圖像。
6.如權利要求1所述的計算機實現的方法,還包括:
所述數據處理裝置接收所述經訓練的卷積神經網絡的第二輸入數據;
所述數據處理裝置基于所述預先計算的可重用因子和所述第二輸入數據,計算所述一個或多個卷積層各自的第二輸出;以及
所述數據處理裝置基于所述一個或多個卷積層各自的所述第二輸出,預測所述經訓練的卷積網絡的第二輸出數據。
7.如權利要求1所述的計算機實現的方法,還包括:
經由用戶界面輸出所述經訓練的卷積網絡的所述輸出數據。
8.一種非暫時性計算機可讀介質,存儲能夠由計算機系統執行以執行操作的一個或多個指令,所述操作包括:
獲得包括一個或多個卷積層的經訓練的卷積神經網絡,所述一個或多個卷積層各自包括具有已知濾波器參數的多個濾波器;
基于所述經訓練的卷積神經網絡的所述已知濾波器參數,預先計算所述一個或多個卷積層各自的可重用因子;
接收所述經訓練的卷積神經網絡的輸入數據;
基于所述預先計算的可重用因子和所述輸入數據,使用Winograd卷積運算符來計算所述一個或多個卷積層各自的輸出;以及
基于所述一個或多個卷積層各自的所述輸出,確定所述經訓練的卷積網絡的輸出數據。
9.如權利要求8所述的非暫時性計算機可讀介質,其中,基于所述經訓練的卷積神經網絡的所述已知濾波器參數,預先計算所述一個或多個卷積層各自的所述可重用因子,包括:
基于所述經訓練的卷積神經網絡的所述已知濾波器參數,離線計算所述一個或多個卷積層各自的所述可重用因子,而不管所述經訓練的卷積神經網絡的所述輸入數據如何。
10.如權利要求8所述的非暫時性計算機可讀介質,所述操作還包括:
保存所述一個或多個卷積層各自的所述預先計算的可重用因子。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880017855.1/1.html,轉載請聲明來源鉆瓜專利網。





