[發明專利]一種計算裝置及相關產品有效
| 申請號: | 201811181151.6 | 申請日: | 2018-10-10 |
| 公開(公告)號: | CN110059797B | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 中科寒武紀科技股份有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 100000 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 裝置 相關 產品 | ||
本申請提供一種計算裝置及相關產品,所述計算裝置用于執行卷積神經網絡訓練運算,本申請提供的計算裝置具有成本低、功耗低的優點。
技術領域
本申請涉及信息處理技術領域,具體涉及一種計算裝置及相關產品。
背景技術
隨著信息技術的不斷發展和人們日益增長的需求,人們對信息及時性的要求越來越高了。目前,終端對信息的獲取以及處理均是基于通用處理器獲得的。
在實踐中發現,這種基于通用處理器運行軟件程序來處理信息的方式,受限于通用處理器的運行速率,特別是在通用處理器負荷較大的情況下,信息處理效率較低、時延較大,對于信息處理的計算模型例如計算模型的卷積訓練來說,卷積訓練的計算量大,通用的處理器完成卷積訓練的時間長,效率低,功耗高。
發明內容
本申請實施例提供了一種計算裝置及相關產品,可提升卷積訓練運算的處理速度,提高效率、節省功耗。
第一方面,提供一種一種計算裝置,所述計算裝置用于執行卷積神經網絡訓練運算,所述卷積神經網絡包括:α層,所述α層中至少有第i層為卷積層;所述計算裝置包括:運算單元以及控制器單元;所述運算單元包括:一個主處理電路和從處理電路,所述α為大于等于2的整數,所述i為整數且小于等于α;所述計算裝置用于執行第i層卷積正向運算和執行第i層卷積反向運算;
所述執行第i層卷積正向運算具體包括:
所述控制器單元,用于獲取第i層輸入數據、第i層卷積核以及第i層正向計算指令;
所述控制器單元,還用于將該正向計算指令解析得到多個正向運算指令,將該多個運算指令以及所述輸入數據、所述卷積核以及多個運算指令發送給所述主處理電路;
所述主處理電路,用于將所述輸入數據廣播給所述從處理電路,將所述卷積核拆分成多個核數據塊,將多個核數據塊分發給所述從處理電路,將所述多個運算指令發送給所述從處理電路;
所述從處理電路,用于依據運算指令對所述輸入數據以及接收到的核數據塊執行卷積運算得到運算結果,并將運算結果傳輸給所述主處理電路;
所述主處理電路,用于對所述運算結果進行拼接處理得到卷積結果;
所述執行第i層卷積反向運算具體包括:
所述控制器單元,還用于獲取第i層輸出結果梯度、第i層卷積核、第i 層輸入數據和反向計算指令;
所述控制器單元,還用于解析所述反向計算指令得到多個反向運算指令,將所述反向運算指令以及所述第i層輸出結果梯度、第i層卷積核、第i層輸入數據發送給所述主處理電路;
所述主處理電路,還用于依據卷積窗口從第i層輸入數據中選取反向運算的第i層反向輸入數據,將所述第i層輸出結果梯度廣播給所述從處理電路,將第i層反向輸入數據拆分成多個反向輸入數據塊,將多個反向輸入數據塊以及多個反向運算指令分發給所述從處理器電路;
所述從處理電路,用于依據接收到的反向運算指令將接收到的反向輸入數據塊與所述第i層輸出結果梯度執行向量乘向量運算得到向量運算結果;將所述向量運算結果返回給所述主處理電路;
所述主處理電路,用于依據該向量運算結果確定第i層卷積核梯度,將第i 層卷積核梯度與第i層卷積核執行更新運算得到第i層更新后的卷積核。
第二方面,本申請實施例提供了一種卷積訓練裝置,其特征在于,所述卷積訓練裝置包括一個或多個第一方面提供的計算裝置,用于從其他處理裝置中獲取待運算數據和控制信息,并執行指定的卷積運算,將執行結果通過I/O接口傳遞給其他處理裝置;
當所述卷積訓練裝置包含多個所述計算裝置時,所述多個所述計算裝置間可以通過特定的結構進行連接并傳輸數據;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科寒武紀科技股份有限公司,未經中科寒武紀科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811181151.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:卷積神經網絡的生成方法及裝置
- 下一篇:開發神經網絡中的稀疏性





