[發(fā)明專利]一種基于Embedded YOLO算法的行人檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011335894.1 | 申請(qǐng)日: | 2020-11-25 |
| 公開(公告)號(hào): | CN112487915A | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 呂峰;王新彥;江泉;易政洋;張凱;盛冠杰 | 申請(qǐng)(專利權(quán))人: | 江蘇科技大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 212008 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 embedded yolo 算法 行人 檢測(cè) 方法 | ||
1.一種基于Embedded YOLO算法的行人檢測(cè)方法,其特征在于,包括以下步驟:
(1)提取數(shù)據(jù)集中所有的行人圖像數(shù)據(jù),將提取到的圖像數(shù)據(jù)隨機(jī)劃分為訓(xùn)練集和測(cè)試集;
(2)基于深度卷積網(wǎng)絡(luò)構(gòu)建Embedded模塊;
(3)用Embedded模塊堆疊并結(jié)合MobileNet、SPP和YOLO層組成整個(gè)Embedded YOLO檢測(cè)網(wǎng)絡(luò)模型;
(4)利用訓(xùn)練集對(duì)Embedded YOLO模型的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲取最優(yōu)的檢測(cè)網(wǎng)絡(luò)模型;
(5)利用步驟(4)獲取的模型對(duì)測(cè)試集中的圖片數(shù)據(jù)進(jìn)行檢測(cè),并對(duì)測(cè)試集的檢測(cè)結(jié)果進(jìn)行檢測(cè)精度、速度和輕量化評(píng)價(jià)。
2.根據(jù)權(quán)利要求1所述的基于Embedded YOLO算法的行人檢測(cè)方法,其特征在于,所述步驟(1)中具體包括以下步驟:
(11)提取數(shù)據(jù)集中所有的person類別的圖像數(shù)據(jù),至少4000份圖像或視頻文件;
(12)按照8:2的比例劃分為訓(xùn)練集和測(cè)試集。
3.根據(jù)權(quán)利要求1所述的基于Embedded算法的行人檢測(cè)方法,其特征在于,所述步驟(2)中構(gòu)建Embedded模塊具體包括以下步驟:
(21)將輸入Embedded模塊的特征圖采用1×1卷積層進(jìn)行通道擴(kuò)張,擴(kuò)張為原來的n1倍,n1為偶數(shù),采用LeakyRelu激活函數(shù);
(22)對(duì)上步輸出的特征圖采用3×3的深度卷積進(jìn)行特征提取,保持通道數(shù)和上步一致,采用LeakyRelu激活函數(shù);
(23)對(duì)上步輸出的特征圖采用1×1卷積層進(jìn)行通道壓縮,壓縮為上步輸出特征圖的三分之一,Embedded模塊起始輸入為上步輸出特征圖的2倍,采用Linear激活函數(shù);
(24)重復(fù)一次(21)~(23)步驟,其中,步驟(21)的擴(kuò)張倍數(shù)改為n2,n2為偶數(shù),各步驟的壓縮倍數(shù)和激活函數(shù)保持不變;
(25)將步驟(24)和(23)的輸出進(jìn)行shortcut連接;
(26)對(duì)步驟(25)的輸出采用1×1卷積進(jìn)行通道融合,通道數(shù)不變,激活函數(shù)采用LeakyRelu;
(27)將上步輸出與Embedded模塊的輸入進(jìn)行shortcut連接。
4.根據(jù)權(quán)利要求3所述的基于Embedded算法的行人檢測(cè)方法,其特征在于,所述步驟(3)中具體包括以下步驟:
(31)將輸入圖像尺寸歸一化處理為352×352×3,采用步長為2的3×3卷積,對(duì)于輸入圖像2倍下采樣,得到尺寸為176×176×16的特征圖;
(32)堆疊方式為:對(duì)于尺寸為176×176的特征圖僅采用一個(gè)步長為2的MobileNet模塊實(shí)現(xiàn)2倍下采樣同時(shí)進(jìn)行特征提取,得到88×88的特征圖;
(33)對(duì)于尺寸為88×88的特征圖采用步長分別為1和2的MobileNet模塊依次實(shí)現(xiàn)特征提取和2倍下采樣,得到尺寸為44×44特征圖;
(34)對(duì)于尺寸為44×44特征圖依次采用的Embedded模塊數(shù)量為3、1和1,中間得到的22×22、11×11特征圖分別再采用一個(gè)步長為2的MobileNet模塊進(jìn)行下采樣;
(35)采用SPP模塊進(jìn)行多重感受野融合。
5.根據(jù)權(quán)利要求1所述的基于Embedded YOLO算法的行人檢測(cè)方法,其特征在于,所述步驟(4)中具體包括以下步驟:
(41)設(shè)置初始參數(shù),包括圖片輸入尺寸、動(dòng)量參數(shù)、權(quán)重衰減正則項(xiàng)參數(shù)、圖片角度變化參數(shù)、飽和度與曝光變化參數(shù)、色調(diào)變化參數(shù)、初始學(xué)習(xí)率、訓(xùn)練總輪數(shù);
(42)使用kmeans++算法在訓(xùn)練集上聚類出錨定框尺寸;
(43)損失函數(shù)采用CIOU指標(biāo),設(shè)置參與損失計(jì)算的IOU閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇科技大學(xué),未經(jīng)江蘇科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011335894.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 實(shí)現(xiàn)遠(yuǎn)程控制的方法
- 在硬盤保護(hù)機(jī)制下模擬內(nèi)存保護(hù)的方法
- Windows XP Embedded系統(tǒng)內(nèi)模擬內(nèi)存保護(hù)的裝置
- 嵌入式高清會(huì)議終端系統(tǒng)
- 一種嵌入式多媒體播放系統(tǒng)及方法
- 基于U盤Windows XP Embedded 隨身操作系統(tǒng)的保護(hù)方法
- 基于QT embedded的同步顯示方法、系統(tǒng)及數(shù)控機(jī)床
- 一種嵌入式操作系統(tǒng)三維圖形制作軟件
- 一種基于SMI-S的異構(gòu)存儲(chǔ)的數(shù)據(jù)采集方法
- 一種基于Embedded YOLO算法的行人檢測(cè)方法
- 基于FPGA的Tiny-yolo卷積神經(jīng)網(wǎng)絡(luò)硬件加速方法及系統(tǒng)
- 一種基于YOLO的Compress-YOLO模型壓縮方法
- 一種面向計(jì)算資源局限平臺(tái)部署的實(shí)時(shí)目標(biāo)檢測(cè)的方法
- 一種用于星上對(duì)艦船目標(biāo)檢測(cè)的Tiny-YOLO網(wǎng)絡(luò)的優(yōu)化方法
- 一種基于改進(jìn)YOLO v3模型的行人檢測(cè)方法
- 一種基于改進(jìn)YOLO v4算法的目標(biāo)檢測(cè)方法
- 一種YOLO脈沖神經(jīng)網(wǎng)絡(luò)的優(yōu)化方法
- 圖像識(shí)別方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及處理器
- 一種船只檢測(cè)方法和裝置
- YOLO神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、行人檢測(cè)方法和相關(guān)設(shè)備





