[發(fā)明專利]卷積神經(jīng)網(wǎng)絡(luò)加速器有效
| 申請(qǐng)?zhí)枺?/td> | 202110741346.7 | 申請(qǐng)日: | 2021-06-30 |
| 公開(kāi)(公告)號(hào): | CN113361695B | 公開(kāi)(公告)日: | 2023-03-24 |
| 發(fā)明(設(shè)計(jì))人: | 陳浩敏;郭曉斌;于力;席禹 | 申請(qǐng)(專利權(quán))人: | 南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司 |
| 主分類號(hào): | G06N3/0464 | 分類號(hào): | G06N3/0464;G06N3/063;G06N3/08 |
| 代理公司: | 華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 周清華 |
| 地址: | 510700 廣東省廣州市黃*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積 神經(jīng)網(wǎng)絡(luò) 加速器 | ||
1.一種卷積神經(jīng)網(wǎng)絡(luò)加速器,其特征在于,包括:卷積加速模塊和池化加速模塊;所述卷積加速模塊的并行輸出通道數(shù)與所述池化加速模塊的并行輸入通道數(shù)相等;所述卷積加速模塊包括卷積行緩存單元、卷積滑窗單元、卷積計(jì)算單元、數(shù)據(jù)累加單元和卷積輸出單元;
所述卷積行緩存單元,用于對(duì)具有第一行數(shù)、第一列數(shù)和多輸入通道的待卷積輸入數(shù)據(jù)進(jìn)行讀取,得到具有第二行數(shù)、所述第一列數(shù)和所述多輸入通道的待卷積緩存數(shù)據(jù),對(duì)所述待卷積緩存數(shù)據(jù)進(jìn)行行緩存;其中,所述第二行數(shù)與卷積核的行數(shù)一致;
所述卷積滑窗單元,用于從所述待卷積緩存數(shù)據(jù)中,提取具有所述第二行數(shù)、第二列數(shù)和所述多輸入通道的待卷積特征數(shù)據(jù);所述第二列數(shù)與所述卷積核的列數(shù)一致;
所述卷積計(jì)算單元,用于將所述待卷積特征數(shù)據(jù)與預(yù)設(shè)組數(shù)的卷積核進(jìn)行通道對(duì)應(yīng)的卷積計(jì)算,得到所述預(yù)設(shè)組數(shù)的卷積計(jì)算結(jié)果,將所述預(yù)設(shè)組數(shù)的卷積計(jì)算結(jié)果傳輸至數(shù)據(jù)累加單元;其中,每組卷積核所包括的卷積核的數(shù)量與所述輸入通道的數(shù)量一致,所述預(yù)設(shè)組數(shù)與所述卷積加速模塊的并行輸出通道數(shù)一致;
所述數(shù)據(jù)累加單元,用于對(duì)同組的卷積計(jì)算結(jié)果進(jìn)行累加,得到對(duì)應(yīng)于所述待卷積特征數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù),并將對(duì)應(yīng)于所述待卷積特征數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù)寫(xiě)入所述卷積輸出單元;
所述卷積輸出單元,用于在基于對(duì)應(yīng)于所述待卷積特征數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù),形成對(duì)應(yīng)于所述待卷積輸入數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù)的情況下,將對(duì)應(yīng)于所述待卷積輸入數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù)輸入至所述池化加速模塊;
所述池化加速模塊,用于對(duì)對(duì)應(yīng)于所述待卷積輸入數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù)進(jìn)行池化處理;
在卷積神經(jīng)網(wǎng)絡(luò)的各網(wǎng)絡(luò)層的輸入數(shù)據(jù)對(duì)應(yīng)于多通道的情況下,各網(wǎng)絡(luò)層的輸入數(shù)據(jù)先被進(jìn)行歸一化處理,映射至特定數(shù)據(jù)區(qū)間,后被進(jìn)行舍棄高位保留低位的溢出處理;所述特定數(shù)據(jù)區(qū)間是根據(jù)定點(diǎn)數(shù)據(jù)的整數(shù)部分位寬和量化因子確定的;所述定點(diǎn)數(shù)據(jù)的位寬和量化因子是對(duì)所述卷積神經(jīng)網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行定點(diǎn)化處理并對(duì)定點(diǎn)化處理后的數(shù)據(jù)進(jìn)行誤差統(tǒng)計(jì)確定的。
2.根據(jù)權(quán)利要求1所述的卷積神經(jīng)網(wǎng)絡(luò)加速器,其特征在于,所述池化加速模塊包括池化行緩存單元、池化滑窗單元、池化計(jì)算單元和池化輸出單元;
所述池化行緩存單元,用于對(duì)所述卷積輸出單元輸出的對(duì)應(yīng)于所述待卷積輸入數(shù)據(jù)的所述預(yù)設(shè)組數(shù)的卷積輸出數(shù)據(jù)進(jìn)行讀取,得到具有第三行數(shù)和第三列數(shù)的待池化緩存數(shù)據(jù),對(duì)所述待池化緩存數(shù)據(jù)進(jìn)行行緩存;其中,所述第三行數(shù)與池化核的行數(shù)一致;
所述池化滑窗單元,用于從所述待池化緩存數(shù)據(jù)匯中提取具有所述第三行數(shù)和第四列數(shù)的待池化特征數(shù)據(jù);其中,所述第四列數(shù)與所述池化核的列數(shù)一致;
所述池化計(jì)算單元,用于利用池化核對(duì)所述待池化特征數(shù)據(jù)進(jìn)行池化計(jì)算,得到池化計(jì)算結(jié)果;
所述池化輸出單元,用于將所述池化計(jì)算結(jié)果作為池化輸出數(shù)據(jù)進(jìn)行輸出。
3.根據(jù)權(quán)利要求1所述的卷積神經(jīng)網(wǎng)絡(luò)加速器,其特征在于,
所述卷積加速模塊和所述池化加速模塊部署在卷積神經(jīng)網(wǎng)絡(luò)加速器的可編程邏輯部分,所述卷積神經(jīng)網(wǎng)絡(luò)加速器還包括處理系統(tǒng)部分;所述處理系統(tǒng)部分,用于向所述卷積行緩存單元傳輸所述待卷積輸入數(shù)據(jù);
所述處理系統(tǒng)與所述卷積行緩存單元之間的并行數(shù)據(jù)傳輸通道數(shù)小于所述卷積加速模塊的并行輸入通道數(shù),且所述并行數(shù)據(jù)傳輸通道數(shù)與所述并行輸入通道數(shù)具有整數(shù)倍關(guān)系。
4.根據(jù)權(quán)利要求1所述的卷積神經(jīng)網(wǎng)絡(luò)加速器,其特征在于,卷積神經(jīng)網(wǎng)絡(luò)的各網(wǎng)絡(luò)層的權(quán)重和偏置被進(jìn)行舍棄高位保留低位的溢出處理;所述各網(wǎng)絡(luò)層的輸出數(shù)據(jù)被進(jìn)行定點(diǎn)數(shù)據(jù)的最大值替代的溢出處理;所述各網(wǎng)絡(luò)層的中間處理數(shù)據(jù)被進(jìn)行位寬擴(kuò)大的溢出處理。
5.根據(jù)權(quán)利要求4所述的卷積神經(jīng)網(wǎng)絡(luò)加速器,其特征在于,所述各網(wǎng)絡(luò)層的權(quán)重和偏置被進(jìn)行舍棄高位保留低位的溢出處理之前,還被進(jìn)行第一預(yù)處理;所述第一預(yù)處理為:用定點(diǎn)數(shù)據(jù)的最大值替代大于定點(diǎn)數(shù)據(jù)范圍的權(quán)重或偏置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,未經(jīng)南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110741346.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





