[發(fā)明專利]一種針對CNN卷積層運算的加速陣列設(shè)計方法在審
| 申請?zhí)枺?/td> | 201810385183.1 | 申請日: | 2018-04-26 |
| 公開(公告)號: | CN108537334A | 公開(公告)日: | 2018-09-14 |
| 發(fā)明(設(shè)計)人: | 周玉山;姜凱;于治樓 | 申請(專利權(quán))人: | 濟南浪潮高新科技投資發(fā)展有限公司 |
| 主分類號: | G06N3/063 | 分類號: | G06N3/063;G06T1/20 |
| 代理公司: | 濟南信達專利事務(wù)所有限公司 37100 | 代理人: | 闞恭勇 |
| 地址: | 250100 山東省濟南市*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積 運算 卷積神經(jīng)網(wǎng)絡(luò) 卷積運算 陣列設(shè)計 計算單元陣列 處理器架構(gòu) 加速技術(shù) 控制數(shù)據(jù) 卷積核 脈動 | ||
1.一種針對CNN卷積層運算的加速陣列設(shè)計方法,其特征在于,
由計算單元PE組成3×5的陣列,支持3×3和5×5的卷積核運算模式,通過控制數(shù)據(jù)和參數(shù)的脈動輸入和在計算單元中的流動傳遞,完成乘法、累加運算后在每列(3×3)或每行(5×5)輸出卷積運算結(jié)果,進而完成卷積運算過程。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
每個PE可以完成相乘、累加和多路選擇的功能,其中多路選擇的功能包括選擇計算的數(shù)據(jù)和輸出結(jié)果的流向。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,
當運算模式為3×3時,輸入圖片以行為單位從左側(cè)輸入,傳輸方向為從左下到右上,左上角的輸入是輸入數(shù)據(jù)的第一行,向下依次為第二行、第三行,底部從左向右,依次為第四行到第七行。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,
當運算模式為5×5時,輸入數(shù)據(jù)的順序與3×3時相反,但是數(shù)據(jù)傳遞的方向不變。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,
運算模式為3×3時,權(quán)重數(shù)據(jù)以行為單位從左側(cè)進入,傳遞方向為從左向右;運算模式為5×5時,權(quán)重數(shù)據(jù)以行為單位從下側(cè)進入,向上傳遞。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,
33的運算模式過程為:
1)數(shù)據(jù)和卷積核權(quán)重從左側(cè)進入,分別是row1、row2、row3的第一個數(shù),以及卷積核各行的第一個數(shù)據(jù),完成相乘運算,結(jié)果暫時緩存在PE內(nèi)的存儲器內(nèi);
2)接下來數(shù)據(jù)向右上傳遞,權(quán)重向右傳輸,則在陣列的第二列完成數(shù)據(jù)的row2、row3、row4這三行數(shù)據(jù)的第一個數(shù)據(jù)與卷積核的各行第一個數(shù)據(jù)的相乘運算,同時,在陣列的第一列完成輸入數(shù)據(jù)的row1、row2、row3的第二個數(shù)據(jù)與卷積核各行的第二個數(shù)據(jù)的相乘運算,并與上一次的結(jié)果進行累加運算;
3)接下來數(shù)據(jù)繼續(xù)向右上傳遞,權(quán)重向右傳輸,在陣列的第三列完成數(shù)據(jù)的row3、row4、row5這三行數(shù)據(jù)的第一個數(shù)據(jù)與卷積核的各行第一個數(shù)據(jù)的相乘運算,同時,在陣列的第二列完成輸入數(shù)據(jù)的row2、row3、row4的第二個數(shù)據(jù)與卷積核各行的第二個數(shù)據(jù)的相乘運算,并與上一次的結(jié)果進行累加運算;在陣列的第一列完成輸入數(shù)據(jù)的row1、row2、row3的第三個數(shù)據(jù)與卷積核各行的第三個數(shù)據(jù)的相乘運算,并與上一次的結(jié)果進行累加運算;
4)在陣列的第一列已經(jīng)完成了第一個卷積核的整個運算,接下來第一列每個PE的計算結(jié)果向上傳遞,并完成累加過程,從上端輸出第一個卷積的計算結(jié)果;接下來每一列的運算與第一列相同;
5)第一列完成卷積運算后,輸入數(shù)據(jù)和權(quán)重繼續(xù)從左側(cè)輸入,這次數(shù)據(jù)輸入的是每行的第二個數(shù)據(jù),權(quán)重依舊是每行的第一個數(shù)據(jù);
6)最后,陣列的計算結(jié)果從上端輸出,每一列的輸出對應(yīng)著output的行。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,
一次運算組合輸出output的5行,運算完成后,轉(zhuǎn)至下面五行繼續(xù)運算。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,
當運算模式為55時,其運算流程與運算模式為33過程不同的是輸入數(shù)據(jù)的順序與33時相反,權(quán)重數(shù)據(jù)從下側(cè)進入,輸出結(jié)果從右側(cè)輸出,每次組合運算輸出3行。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于濟南浪潮高新科技投資發(fā)展有限公司,未經(jīng)濟南浪潮高新科技投資發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810385183.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標檢測方法及檢測裝置





