[發(fā)明專利]一種基于EVP_YOLO的室內(nèi)物品檢測方法在審
| 申請?zhí)枺?/td> | 202011632422.2 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112784694A | 公開(公告)日: | 2021-05-11 |
| 發(fā)明(設(shè)計)人: | 沈雷;王方杰;李東輝 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 evp_yolo 室內(nèi) 物品 檢測 方法 | ||
本發(fā)明公開了一種基于EVP_YOLO的室內(nèi)物品檢測方法。本發(fā)明包括以下步驟:S1、構(gòu)建EVP_YOLO的主體網(wǎng)絡(luò),主體網(wǎng)絡(luò)擁有五個特征層和一個池化層,每個特征層都采用回流殘差結(jié)構(gòu);S2、對完成卷積的結(jié)果標(biāo)準(zhǔn)化處理后送入激活函數(shù)中;S3、對激活函數(shù)輸出值進(jìn)行標(biāo)簽平滑處理:S4、訓(xùn)練網(wǎng)絡(luò)模型;S5、對訓(xùn)練好的網(wǎng)絡(luò)模型輸入測試數(shù)據(jù),進(jìn)行自動目標(biāo)檢測。本發(fā)明以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)搭建出層數(shù)更多結(jié)構(gòu)更加完善的目標(biāo)識別算法EVP_YOLO。經(jīng)測試證明此模型對室內(nèi)的小件物品識別度明顯增高,檢測結(jié)果的準(zhǔn)確率也較為理想。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機視覺領(lǐng)域,具體涉及一種基于EVP_YOLO的深度學(xué)習(xí)模型在室內(nèi)物體檢測場景的具體應(yīng)用。
背景技術(shù)
隨著社會的發(fā)展人們的安全意識也在不斷的提高,視頻監(jiān)控在百姓家中的普及率也迅速增加。視頻數(shù)據(jù)爆發(fā)式增加,如何將相對有效的信息從中提取出來成為了一個亟待解決的問題。要想充分發(fā)揮視頻監(jiān)控的作用,室內(nèi)目標(biāo)自動檢測系統(tǒng)就顯得尤為重要。
當(dāng)前基于深度學(xué)習(xí)的目標(biāo)檢測算法可以大致分為兩類,一類是將目標(biāo)檢測分為兩步(two stage)進(jìn)行的算法(R-CNN,F(xiàn)ast R-CNN, Faster R-CNN,SPP-net),此類算法依賴區(qū)域特征提取,需要先使用啟發(fā)式方法(selective search)或者CNN網(wǎng)絡(luò)(RPN)在候選框中提取目的信息,然后再對目的信息進(jìn)行分類和回歸處理。另一種則是一步 (one stage)進(jìn)行的,如YOLO、SSD等,此類模型不依賴于區(qū)域特征提取,僅使用一個框架網(wǎng)絡(luò)直接預(yù)測不同目標(biāo)的類別與位置。兩類模型各有好壞,第一類準(zhǔn)確度高一些,但是速度較慢;第二類速度快,但是準(zhǔn)確性要低一些,隨著硬件設(shè)施的不斷進(jìn)步以及算法的逐漸優(yōu)化此類算法開始占據(jù)主流。在保持高檢測速率的前提下提高模型目標(biāo)檢測的精度一直是人們研究的主要方向。
發(fā)明內(nèi)容
本發(fā)明的目的是對于現(xiàn)有的室內(nèi)物品檢測算法檢測不準(zhǔn)確的問題,提供一種基于EVP_YOLO的室內(nèi)物品檢測方法。
本發(fā)明所采用的技術(shù)方案包括以下步驟:
S1、構(gòu)建EVP_YOLO的主體網(wǎng)絡(luò),主體網(wǎng)絡(luò)擁有五個特征層和一個池化層,每個特征層都采用回流殘差結(jié)構(gòu)。前兩個特征層為公共特征層,后三個特征層位于主干網(wǎng)絡(luò)的不同位置,后三個特征層經(jīng)過多次卷積所提取的特征數(shù)據(jù)被分為兩部分,一部分用于該特征層的結(jié)果預(yù)測,另一部分采用回流結(jié)構(gòu),進(jìn)行卷積后再重新輸入到前一個特征層。池化層負(fù)責(zé)將卷積后的數(shù)據(jù)進(jìn)行池化處理,池化處理后的數(shù)據(jù)也分為兩部分,一部分用于直接輸出,另一部分同樣采用回流結(jié)構(gòu),回傳至前一個特征層用以增加邊界框視野,從而分離出更加顯著的上下文特征。數(shù)據(jù)進(jìn)行再次回流后邊界框的感受視野將會增加。其整體架構(gòu)的優(yōu)越性使得整體很容易被優(yōu)化,并且能夠通過增加相當(dāng)?shù)纳疃葋硖岣哳A(yù)測的準(zhǔn)確率。不同的殘差塊之間使用了階躍式連接,也較大程度地緩解了在深度神經(jīng)網(wǎng)絡(luò)中增加深度帶來的梯度消失問題。并且其每一個卷積部分都使用了特有的正則化卷積結(jié)構(gòu)(Darknet Conv2D),每一次卷積的時都會進(jìn)行正則化處理。
S2、對完成卷積的結(jié)果標(biāo)準(zhǔn)化(Batch Normaliz ation)處理后送入激活函數(shù)(Mish)之中。普通的激活函數(shù)(LeakyReLu)是給所有負(fù)值賦予一個非零斜率,而Mish函數(shù)則更加的平滑,具有更好的泛化能力,并且Mish函數(shù)并不是一個單調(diào)函數(shù)此性質(zhì)對于整體數(shù)據(jù)中的小的負(fù)值更加友好,從而使網(wǎng)絡(luò)中的梯度流也更加的穩(wěn)定。以數(shù)學(xué)的方式表示為:
式中,Mish(*)為激活函數(shù),x為輸入數(shù)據(jù),該數(shù)據(jù)是完成卷積后標(biāo)準(zhǔn)化數(shù)據(jù)。
S3、對激活函數(shù)輸出值進(jìn)行標(biāo)簽平滑處理:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011632422.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





