[發(fā)明專利]一種目標(biāo)檢測系統(tǒng)、方法、裝置、設(shè)備及介質(zhì)有效
| 申請?zhí)枺?/td> | 202110622240.5 | 申請日: | 2021-06-04 |
| 公開(公告)號: | CN113255682B | 公開(公告)日: | 2021-11-16 |
| 發(fā)明(設(shè)計)人: | 廖丹萍 | 申請(專利權(quán))人: | 浙江智慧視頻安防創(chuàng)新中心有限公司 |
| 主分類號: | G06K9/38 | 分類號: | G06K9/38;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京辰權(quán)知識產(chǎn)權(quán)代理有限公司 11619 | 代理人: | 谷波 |
| 地址: | 311215 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標(biāo) 檢測 系統(tǒng) 方法 裝置 設(shè)備 介質(zhì) | ||
本公開提供了一種目標(biāo)檢測系統(tǒng)、方法、裝置、介質(zhì)及設(shè)備,其中,所述系統(tǒng)包括:輸入模塊,用于接收輸出的圖像數(shù)據(jù);特征提取模塊,用于將所述圖像數(shù)據(jù)經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)特征特取以得到提取特征圖;候選區(qū)域建議模塊,用于接收所述特征圖,輸出包含目標(biāo)的前景區(qū)域的粗略邊框位置和背景區(qū)域邊框位置;候選區(qū)域提取模塊,用于利用所述候選區(qū)域建議模塊輸出的邊框位置,從所述特征圖中裁剪出候選背景區(qū)域和前景區(qū)域,并將區(qū)域調(diào)整成相同大小,得到候選區(qū)域;檢測模塊,用于將得到的候選區(qū)域進行分類,并利用邊框回歸算法對前景候選區(qū)域的邊框位置進行進一步修正,得到檢測目標(biāo)的最終位置。
技術(shù)領(lǐng)域
本公開涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,更為具體來說,本公開涉及一種目標(biāo)檢測系統(tǒng)、方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù)
目標(biāo)檢測是計算機視覺和數(shù)字圖像處理的重要研究方向,廣泛應(yīng)用于機器人導(dǎo)航、智能視頻監(jiān)控、工業(yè)檢測、航空航天等諸多領(lǐng)域。目標(biāo)檢測的目標(biāo)是找出圖像中感興趣的對象,包含物體定位和物體分類兩個子任務(wù),即同時確定物體的類別和位置。
目前,利用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合大量圖片數(shù)據(jù)進行訓(xùn)練的目標(biāo)檢測模式已經(jīng)成為行業(yè)的主流方式。基于神經(jīng)網(wǎng)絡(luò)的算法基本上可以歸為兩類:以Faster R-CNN為代表的兩階段算法和以YOLO、SSD等為代表的一階段算法。
以Faster R-CNN為代表的兩階段模型大致包括五個模塊:
輸入模塊:該模塊接收輸入圖像。
特征提取模塊:該模塊將輸入圖像經(jīng)過一系列的卷積神經(jīng)網(wǎng)絡(luò)提取特征圖。
候選區(qū)域建議模塊(Region Proposal Network, RPN):該模塊接收特征圖,輸出包含目標(biāo)的前景區(qū)域的粗略邊框位置和背景區(qū)域邊框位置。
候選區(qū)域提取模塊:該模塊利用RPN輸出的邊框位置,從特征圖中裁剪出候選背景區(qū)域和前景區(qū)域,并將候選區(qū)域調(diào)整成相同大小。
檢測模塊:該模塊將得到的候選區(qū)域進行分類,并利用邊框回歸算法對邊框位置進行進一步修正,得到檢測區(qū)域的最終位置。
檢測模塊需要將獲得的候選區(qū)域進行分類,判斷其屬于哪一類前景對象或者是背景。分類的前提步驟是構(gòu)建候選區(qū)特征圖訓(xùn)練集,包括候選區(qū)域?qū)?yīng)的特征圖和標(biāo)簽。候選區(qū)域的標(biāo)簽一般通過候選區(qū)域和真實邊框的交并比(intersection over union ,IoU)來確定。通常,檢測模塊會設(shè)定一個固定的IoU閾值。當(dāng)候選區(qū)域與某個真實邊框的IoU大于該IoU閾值,則其標(biāo)簽為真實邊框所包含的物體類別(正樣本)。若候選區(qū)域與所有真實邊框的IoU都小于IoU閾值,則其標(biāo)簽為背景類(負樣本)。實驗觀察發(fā)現(xiàn),當(dāng)IoU的閾值設(shè)置得比較低的時候,會有大量的低質(zhì)量候選區(qū)域被貼上正樣本標(biāo)簽。在這種情況下,檢測器會產(chǎn)生較多的不準(zhǔn)確邊框。而當(dāng)IoU的閾值設(shè)置得比較高的時候,雖然候選區(qū)域質(zhì)量提高了,但是正樣本數(shù)量大大下降,模型容易過擬合。
發(fā)明內(nèi)容
為解決現(xiàn)有的基于深度學(xué)習(xí)的目標(biāo)檢測算法準(zhǔn)確度不夠高的技術(shù)問題,本公開提供了一種目標(biāo)檢測系統(tǒng),包括:
輸入模塊,用于接收輸出的圖像數(shù)據(jù);
特征提取模塊,用于將所述圖像數(shù)據(jù)經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)以提取特征圖;
候選區(qū)域建議模塊,用于接收所述特征圖,輸出包含目標(biāo)的前景區(qū)域的粗略邊框位置和背景區(qū)域邊框位置;
候選區(qū)域提取模塊,用于利用所述候選區(qū)域建議模塊輸出的邊框位置,從所述特征圖中裁剪出候選背景區(qū)域和前景區(qū)域,并將區(qū)域調(diào)整成相同大小,得到候選區(qū)域;
檢測模塊,用于將得到的候選區(qū)域進行分類,并利用邊框回歸算法對前景候選區(qū)域的邊框位置進行進一步修正,得到檢測目標(biāo)的最終位置。
進一步,
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江智慧視頻安防創(chuàng)新中心有限公司,未經(jīng)浙江智慧視頻安防創(chuàng)新中心有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110622240.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 目標(biāo)檢測裝置、學(xué)習(xí)裝置、目標(biāo)檢測系統(tǒng)及目標(biāo)檢測方法
- 目標(biāo)監(jiān)測方法、目標(biāo)監(jiān)測裝置以及目標(biāo)監(jiān)測程序
- 目標(biāo)監(jiān)控系統(tǒng)及目標(biāo)監(jiān)控方法
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤設(shè)備
- 目標(biāo)跟蹤方法和目標(biāo)跟蹤裝置
- 目標(biāo)檢測方法和目標(biāo)檢測裝置
- 目標(biāo)跟蹤方法、目標(biāo)跟蹤裝置、目標(biāo)跟蹤設(shè)備
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)處理方法、目標(biāo)處理裝置、目標(biāo)處理設(shè)備及介質(zhì)
- 目標(biāo)跟蹤系統(tǒng)及目標(biāo)跟蹤方法





