[發明專利]一種CNN卷積層運算方法及CNN卷積層運算加速器有效
| 申請號: | 202010791455.5 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111967582B | 公開(公告)日: | 2022-07-08 |
| 發明(設計)人: | 楊繼林 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063;G06T1/20 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 張營磊 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 cnn 卷積 運算 方法 加速器 | ||
本發明提供一種CNN卷積層運算方法及CNN卷積層運算加速器,均能夠:讀入用于對待處理特征圖像進行CNN卷積層運算的卷積核,并將讀入的卷積核轉化為權重矩陣H(hpq);按照預先設定的圖像大小閾值,讀取待處理特征圖像上的一個分塊圖像,并依據所述的權重矩陣H(hpq)計算當前所讀入的分塊圖像對應的CNN卷積層局部運算結果;判斷整幅待處理特征圖像是否讀取完成:若是,則按照各所述分塊圖像之間的相對位置關系排布所得到的各CNN卷積層局部運算結果,并拼接得到整幅待處理特征圖像對應的CNN卷積層運算結果;若否則繼續讀入下一個分塊圖像。本發明用于降低CNN卷積運算的復雜度、降低存儲帶寬壓力以及降低完成CNN卷積層運算的成本。
技術領域
本發明涉及卷積運算加速領域,具體涉及一種CNN卷積層運算方法及CNN卷積層運算加速器。
背景技術
隨著CNN(Convolutional Neural Networks,卷積神經網絡)的不斷發展,CNN在圖像分類、圖像識別等領域的應用越來越廣泛。
CNN卷積層的運算是二維卷積,常見的實現方案是滑窗實現卷積計算,即對k×k卷積核采用專門的控制模塊獲取同樣大小的特征圖二維窗,然后將該特征圖二維窗在需要進行卷積層計算的特征圖上滑動,之后將需要進行卷積層計算的特征圖與卷積核對應點做乘加運算。滑窗實現二維卷積的方法比較直觀,只要能獲取到正確的特征圖二維窗,之后的計算過程相對簡單。但是,用于產生二維窗的控制模塊實現比較復雜。另外,對于k×k卷積核、對于在線輸入的需要進行卷積層計算的特征圖,往往需要額外增加k-1行存儲,由此帶來了成本的增加。此外,現有CNN卷積層運算過程中往往需要多次重復讀取卷積核中的權重,一定程度上增加了存儲帶寬壓力。
為此,本發明提供一種CNN卷積層運算方法及CNN卷積層運算加速器,用于解決上述問題。
發明內容
針對現有技術的上述不足,本發明提供一種CNN卷積層運算方法及CNN卷積層運算加速器,用于降低CNN卷積運算的復雜度。本發明還用于降低存儲帶寬壓力。本發明還用于降低完成CNN卷積層運算的成本。
第一方面,本發明提供一種CNN卷積層運算方法,包括步驟:
S1、讀入用于對待處理特征圖像進行CNN卷積層運算的卷積核,并將讀入的卷積核轉化為權重矩陣H(hpq),其中,卷積核為k×k卷積核,hpq為權重矩陣H(hpq)的(p,q)元素,p=0,1,2,…,k-1;q=0,1,2,…,k-1;
S2、按照預先設定的圖像大小閾值,分塊圖像讀取待處理特征圖像上的一個分塊圖像,并依據所述的權重矩陣H(hpq)計算當前所讀入的分塊圖像對應的CNN卷積層局部運算結果;
S3、判斷整幅待處理特征圖像是否讀取完成,若是,則繼續執行步驟S4,否則轉而重復執行步驟S2;
S4、按照各所述分塊圖像之間的相對位置關系,排布步驟S2中得到的各CNN卷積層局部運算結果,之后拼接得到整幅待處理特征圖像對應的CNN卷積層運算結果;
其中,步驟S2中依據所述的權重矩陣H(hpq)計算當前所讀入的分塊圖像對應的CNN卷積層局部運算結果的實現方法包括步驟:
P1、將當前讀入的分塊圖像轉化為圖像矩陣A(aij),其中,分塊圖像為m×n像素的數字圖像,aij為圖像矩陣A(aij)的(i,j)元素;其中,i=0,1,2,...,m-1;j=0,1,2,...,n-1;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010791455.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種顯示面板及顯示裝置
- 下一篇:一種多功能的太陽能智慧路燈桿





