[發(fā)明專利]一種基于FPGA加速的MobileNet-SSD目標(biāo)檢測(cè)裝置及方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110434593.2 | 申請(qǐng)日: | 2021-04-22 |
| 公開(公告)號(hào): | CN113051216B | 公開(公告)日: | 2023-07-11 |
| 發(fā)明(設(shè)計(jì))人: | 程明;潘國(guó)標(biāo) | 申請(qǐng)(專利權(quán))人: | 南京工業(yè)大學(xué) |
| 主分類號(hào): | G06F15/78 | 分類號(hào): | G06F15/78;G06F13/42;G06N3/0464;G06N3/063 |
| 代理公司: | 南京燦爛知識(shí)產(chǎn)權(quán)代理有限公司 32356 | 代理人: | 趙麗 |
| 地址: | 211816 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 fpga 加速 mobilenet ssd 目標(biāo) 檢測(cè) 裝置 方法 | ||
1.一種基于FPGA加速的MobileNet-SSD目標(biāo)檢測(cè)方法,其特征在于,包括如下步驟:
Step1:獲取待檢測(cè)目標(biāo)初始圖像,存儲(chǔ)目標(biāo)初始圖像數(shù)據(jù)和卷積神經(jīng)網(wǎng)絡(luò)權(quán)值文件;
Step2:在Mobilenet-SSD卷積神經(jīng)網(wǎng)絡(luò)中加入檢測(cè)層,在不同網(wǎng)絡(luò)層間共享加速器,加速器上設(shè)置片上緩沖區(qū);
Step3:通過(guò)并行分塊參數(shù)優(yōu)化法運(yùn)行Mobilenet-SSD卷積神經(jīng)網(wǎng)絡(luò),輸出目標(biāo)圖像的特征圖通道和卷積核通道的分塊系數(shù);
Step4:通過(guò)流水線算法,完成Mobilenet-SSD卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)特征提取、邊界框回歸及物體類別預(yù)測(cè);
Step5:對(duì)卷積神經(jīng)網(wǎng)絡(luò)得到的目標(biāo)特征提取、邊界框回歸及物體類別預(yù)測(cè)信息進(jìn)行后處理;
Stsp6:在待檢測(cè)目標(biāo)圖像上測(cè)試目標(biāo)檢測(cè)結(jié)果;
其中,Step3中并行分塊參數(shù)優(yōu)化法包括如下步驟:
Step3.1:分別計(jì)算輸入特征值的寬和高的分塊系數(shù)Twi和Thi:
Twi=S*Tw+K-S??(1)
Thi=S*Th+K-S??(2)
其中,Twi表示輸入特征值的寬的分塊系數(shù),Thi表示輸入特征值的高的分塊系數(shù),Tw表示輸出特征圖的寬的分塊系數(shù),Th表示輸出特征圖的高的分塊系數(shù),K表示卷積核的大小,S表示卷積步長(zhǎng),
Step3.2:基于分塊系數(shù),計(jì)算通信比CR:
其中,CR表示通信比,W表示輸出特征圖的寬,H表示輸出特征圖的高,M表示輸出特征圖的通道數(shù),N表示輸出特征圖的卷積核通道數(shù),K表示卷積核的大小,αin表示輸入層所需計(jì)算存儲(chǔ)的所有分塊數(shù),βin表示輸入層所需計(jì)算存儲(chǔ)的分塊數(shù)大小,αw表示卷積層所需計(jì)算存儲(chǔ)的所有分塊數(shù),βw表示卷積層所需計(jì)算存儲(chǔ)的分塊數(shù)的大小,αout表示輸出層所需計(jì)算存儲(chǔ)的所有分塊數(shù),βout表示輸出層所需計(jì)算存儲(chǔ)的分塊數(shù)的大小,
上述公式中,αin、βin、αw、βw、αout和βout分別基于下述公式求解:
βin=TniTwiThi??(4)
βw=TmTnK2??(5)
βout=TmTwTh??(6)
其中,Tni表示輸入特征圖的通道對(duì)應(yīng)的分塊系數(shù),Tw表示輸出特征圖的寬的分塊系數(shù),表示,Th表示輸出特征圖的高的分塊系數(shù),Tm表示輸出特征圖的通道數(shù)的分塊系數(shù),Tn表示輸出特征圖的卷積核通道數(shù)的分塊系數(shù),
Step3.3:按照資源瓶頸近似公式,計(jì)算資源瓶頸R:
其中,R表示資源瓶頸,與總操作數(shù)和系統(tǒng)時(shí)鐘頻率正向相關(guān),與執(zhí)行周期數(shù)反向相關(guān),Step3.4:基于約束條件,在Mobilenet-SSD卷積神經(jīng)網(wǎng)絡(luò)下求解全局最優(yōu)的Tm和Tn:
其中,C0為片上緩存量,AP表示可取的計(jì)算能力,TW表示帶寬;
Step4中流水線包括如下步驟:
Step4.1:將Mobilenet-SSD卷積神經(jīng)網(wǎng)絡(luò)中不同數(shù)據(jù)流的計(jì)算步驟在一個(gè)時(shí)鐘周期內(nèi)完成;
Step4.2:在一定閾值下回歸出類別概率較高的預(yù)測(cè)框的真實(shí)位置并進(jìn)行降序排列;
Step4.3:不同數(shù)據(jù)緩沖模塊在不同時(shí)鐘周期分別讀寫數(shù)據(jù);
Step4.4:每達(dá)到時(shí)鐘周期的一半時(shí),每個(gè)數(shù)據(jù)緩沖模塊一邊繼續(xù)讀數(shù)據(jù),一邊將前半個(gè)時(shí)鐘周期讀取的數(shù)據(jù)開始向數(shù)據(jù)處理模塊寫入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京工業(yè)大學(xué),未經(jīng)南京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110434593.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:可折疊顯示器
- 下一篇:一種微電解式次氯酸傷口敷料貼及使用方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F15-00 通用數(shù)字計(jì)算機(jī)
G06F15-02 .通過(guò)鍵盤輸入的手動(dòng)操作,以及應(yīng)用機(jī)內(nèi)程序的計(jì)算,例如,袖珍計(jì)算器
G06F15-04 .在引入被處理的數(shù)據(jù)的同時(shí),進(jìn)行編制程序的,例如,在同一記錄載體上
G06F15-08 .應(yīng)用插接板編制程序的
G06F15-16 .兩個(gè)或多個(gè)數(shù)字計(jì)算機(jī)的組合,其中每臺(tái)至少具有一個(gè)運(yùn)算器、一個(gè)程序器及一個(gè)寄存器,例如,用于數(shù)個(gè)程序的同時(shí)處理
G06F15-18 .其中,根據(jù)計(jì)算機(jī)本身在一個(gè)完整的運(yùn)行期間內(nèi)所取得的經(jīng)驗(yàn)來(lái)改變程序的;學(xué)習(xí)機(jī)器
- 基于D-MobileNet神經(jīng)網(wǎng)絡(luò)的圖像分類方法
- 基于多遷移學(xué)習(xí)模型融合的大壩裂縫檢測(cè)方法
- 嵌入式設(shè)備的人臉檢測(cè)方法及裝置、存儲(chǔ)介質(zhì)、終端
- 基于改進(jìn)的MobileNet網(wǎng)絡(luò)對(duì)乳腺癌進(jìn)行分類的方法
- 一種快速行人檢測(cè)方法及系統(tǒng)
- 一種手掌圖像識(shí)別方法、系統(tǒng)及設(shè)備
- 一種基于改進(jìn)MobileNet網(wǎng)絡(luò)進(jìn)行垃圾分類的方法及工具
- 基于MobileNet v2網(wǎng)絡(luò)改進(jìn)的果實(shí)成熟度識(shí)別方法和識(shí)別系統(tǒng)
- 一種人臉采集特征訓(xùn)練方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 一種基于FPGA加速的MobileNet-SSD目標(biāo)檢測(cè)裝置及方法





