[發明專利]卷積運算處理方法及相關產品有效
| 申請號: | 201711283173.9 | 申請日: | 2017-12-06 |
| 公開(公告)號: | CN108304923B | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 章恒;張陽明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06N3/04 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 運算 處理 方法 相關 產品 | ||
本發明實施例公開一種卷積運算處理方法及相關產品,集成芯片包括控制器、卷積處理器、輸入緩存、輸出緩存。控制器將分段卷積核和分段卷積輸入數據載入到輸入緩存;分段卷積核為卷積核分段得到的數據;分段卷積輸入數據為卷積輸入數據分段得到的數據;卷積處理器對分段卷積核和分段卷積輸入數據進行分段卷積運算得到分段卷積結果,將分段卷積結果存儲到輸出緩存。實施本發明實施例可以減少卷積運算所需的電路數量。
技術領域
本發明涉及計算機技術領域,尤其涉及卷積運算處理方法及相關產品。
背景技術
在人工智能領域,目前主流的人工智能算法是深度學習。在深度學習里面,卷積神經網絡(Convolution Nero Network,CNN)因為其在圖像領域的突出效果,成為目前最為廣泛應用的神經網絡之一。CNN和其他深度學習一樣,需要的計算量大。
為了提高CNN的計算效率,一般使用集成芯片進行CNN的計算,CNN計算的核心是卷積運算。在進行卷積運算時,集成芯片將卷積核展開為卷積核矩陣,將卷積輸入數據展開為卷積輸入矩陣,將卷積核矩陣的一行與卷積輸入矩陣的一列進行矩陣乘積運算。
當卷積核和卷積輸入數據的數據量較大時,每次矩陣乘積運算所需要的數據量同樣較大,由于不同的卷積運算的卷積核和卷積輸入數據大小不同,為了保證集成芯片能夠適用于所有的卷積運算,需要將集成芯片中用于卷積運算的電路的數量設置得非常大,這會造成電路的浪費。
發明內容
本發明實施例公開卷積運算處理方法及相關產品,可以減少電路數量的需求。
本發明實施例第一方面公開一種集成芯片,所述集成芯片包括:控制器、卷積處理器、輸入緩存、輸出緩存;
所述控制器將分段卷積核和分段卷積輸入數據載入到所述輸入緩存;所述分段卷積核為卷積核分段得到的數據;所述分段卷積輸入數據為卷積輸入數據分段得到的數據;
所述卷積處理器對所述分段卷積核和所述分段卷積輸入數據進行分段卷積運算得到分段卷積結果,將所述分段卷積結果存儲到所述輸出緩存。
可選的,所述輸入緩存包含第一存儲空間和第二存儲空間,所述第一存儲空間和所述第二存儲空間分別用于存儲一個數據;所述控制器將所述分段卷積核載入所述輸入緩存包括:
在所述第二存儲空間內的數據參與分段卷積運算結束后,所述控制器將所述第一存儲空間內的數據移動到所述第二存儲空間,然后將所述分段卷積核載入所述第一存儲空間。
可選的,若所述第一存儲空間和所述第二存儲空間為空,所述控制器將所述分段卷積核載入所述輸入緩存包括:
所述控制器將所述分段卷積核載入所述第二存儲空間;
所述控制器還用于在所述第一存儲空間載入所述分段卷積核之外的另一分段卷積核。
本發明實施例第二方面公開一種卷積運算處理方法,包括:
將分段卷積核和分段卷積輸入數據載入到輸入緩存;所述分段卷積核為卷積核分段得到的數據,所述分段卷積輸入數據為所述卷積輸入數據分段得到的數據;
對所述分段卷積核和所述分段卷積輸入數據進行分段卷積運算得到分段卷積結果,將所述分段卷積結果存儲到輸出緩存。
本發明實施例第三方面公開一種卷積運算處理裝置,包括存儲器和處理器,所述存儲器用于存儲程序指令,所述程序指令適于由所述處理器加載;
所述處理器,用于加載所述程序指令并執行本發明實施例第二方面所述的卷積運算處理方法。
本發明實施例第四方面公開一種存儲介質,所述存儲介質中存儲有多條程序指令,所述程序指令適于由處理器加載并執行本發明實施例第二方面所述的卷積運算處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711283173.9/2.html,轉載請聲明來源鉆瓜專利網。





