[發(fā)明專(zhuān)利]一種CNN加速方法、加速裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010412121.2 | 申請(qǐng)日: | 2020-05-15 |
| 公開(kāi)(公告)號(hào): | CN111626405A | 公開(kāi)(公告)日: | 2020-09-04 |
| 發(fā)明(設(shè)計(jì))人: | 史超超 | 申請(qǐng)(專(zhuān)利權(quán))人: | TCL華星光電技術(shù)有限公司 |
| 主分類(lèi)號(hào): | G06N3/04 | 分類(lèi)號(hào): | G06N3/04;G06N3/08;G06F13/28 |
| 代理公司: | 深圳紫藤知識(shí)產(chǎn)權(quán)代理有限公司 44570 | 代理人: | 楊艇要 |
| 地址: | 518132 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 cnn 加速 方法 裝置 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)公開(kāi)了一種CNN加速方法、加速裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該加速方法和加速裝置用于FPGA。所述方法為:通過(guò)DMA接口將完成邊界填充的圖像數(shù)據(jù)緩存進(jìn)入行緩存區(qū);調(diào)用FPGA內(nèi)置的硬件加速單元對(duì)所述的行緩存區(qū)內(nèi)的數(shù)據(jù)進(jìn)行卷積運(yùn)算,所述的卷積運(yùn)算的卷積核大小為N×N,每個(gè)卷積層的行緩存接口數(shù)量為N;將完成卷積運(yùn)算的像素緩存至緩存區(qū),并通過(guò)DMA端口傳輸至外部DDR。所述裝置包括:第一存儲(chǔ)模塊、運(yùn)算模塊和第二存儲(chǔ)模塊。所述存儲(chǔ)介質(zhì)中存儲(chǔ)有多條指令,所述指令適于由處理器加載以執(zhí)行本發(fā)明所述的CNN加速方法。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù),特別是涉及CNN加速方法、加速裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱(chēng)為CNN)是圖像處理中最重要、最常用的算法之一。CNN運(yùn)算量大,運(yùn)算時(shí)間長(zhǎng),設(shè)計(jì)高效的CNN硬件加速器難度較大,因而現(xiàn)階段一般使用純軟件方式調(diào)用CPU(Central Processing Unit)及GPU(GraphicProcessing Unit)進(jìn)行CNN加速運(yùn)算,但加速效果往往受限于GPU計(jì)算單元數(shù)量,所以加速效果并不理想。此外,GPU價(jià)格高昂,不利于產(chǎn)品批量生產(chǎn)及推廣。
針對(duì)現(xiàn)有技術(shù)中存在的CNN加速效果不理想的問(wèn)題,目前還沒(méi)有提出有效的解決方法。
發(fā)明內(nèi)容
本發(fā)明提供一種CNN加速方法、加速裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用軟硬件相結(jié)合的方式,有效提高了CNN加速效果。
為解決上述問(wèn)題,第一方面,本發(fā)明提供了一種CNN加速方法,該方法用于FPGA(Field-Programmable Gate Array),該方法包括:
通過(guò)直接存儲(chǔ)器訪問(wèn)(DMA,Direct Memory Access)接口將完成邊界填充的圖像數(shù)據(jù)緩存進(jìn)入行緩存區(qū);
調(diào)用FPGA內(nèi)置的硬件加速單元對(duì)所述的行緩存區(qū)內(nèi)的數(shù)據(jù)進(jìn)行卷積運(yùn)算,所述的卷積運(yùn)算的卷積核大小為N×N,每個(gè)卷積層的行緩存接口數(shù)量為N;
將完成卷積運(yùn)算的像素緩存至緩存區(qū),并通過(guò)DMA端口傳輸至外部DDR(DoubleData Rate)。
其中,所述的卷積運(yùn)算包括:
從bram(bipolar random access memory)中抓取所需要的N2個(gè)像素及對(duì)應(yīng)的權(quán)重;
通過(guò)非0值判斷模塊判斷所述的N2個(gè)像素及對(duì)應(yīng)的權(quán)重是否存在零值;
對(duì)抓取的像素矩陣及對(duì)應(yīng)的權(quán)重矩陣進(jìn)行卷積計(jì)算:當(dāng)所述的N2個(gè)像素及對(duì)應(yīng)的權(quán)重不存在零值時(shí),利用N2個(gè)乘法器對(duì)所述像素矩陣中的元素及所述權(quán)重矩陣中的元素進(jìn)行乘法運(yùn)算,然后利用N2-1個(gè)加法器對(duì)所述的N2個(gè)乘法器的輸出數(shù)據(jù)相加,完成卷積運(yùn)算;當(dāng)所述的N2個(gè)像素及對(duì)應(yīng)的權(quán)重存在零值時(shí),則在使用乘法器進(jìn)行乘法運(yùn)算時(shí),忽略掉所述零值對(duì)應(yīng)的相乘項(xiàng)。
其中,所述CNN加速方法還包括:
調(diào)用HLS pipeline unroll指令;
且所述的調(diào)用HLS pipeline unroll指令與所述的卷積運(yùn)算同時(shí)進(jìn)行。
其中,所述CNN加速方法還包括:
對(duì)所述的卷積運(yùn)算及將完成卷積運(yùn)算的像素緩存至緩存區(qū)進(jìn)行數(shù)據(jù)流操作。
其中,所述的邊界填充由ARM(Advanced RISC Machine)CPU端完成。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于TCL華星光電技術(shù)有限公司,未經(jīng)TCL華星光電技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010412121.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 圖像語(yǔ)義標(biāo)注的設(shè)備和方法及其模型的生成方法和系統(tǒng)
- 使用卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像處理
- 為數(shù)據(jù)庫(kù)確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 確定卷積神經(jīng)網(wǎng)絡(luò)CNN模型的裝置和方法
- 采用嵌入式系統(tǒng)中的小規(guī)模卷積神經(jīng)網(wǎng)絡(luò)模塊的人臉檢測(cè)
- 針對(duì)深度通道和卷積神經(jīng)網(wǎng)絡(luò)圖像和格式使用相機(jī)設(shè)備的方法和系統(tǒng)
- 處理卷積神經(jīng)網(wǎng)絡(luò)的方法
- CNN加速器和電子設(shè)備
- 一種基于混合神經(jīng)網(wǎng)絡(luò)的腦電時(shí)空特征學(xué)習(xí)與情感分類(lèi)方法
- 一種基于FPGA的深度學(xué)習(xí)加速方法
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





