[發(fā)明專利]一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110280998.5 | 申請(qǐng)日: | 2021-03-16 |
| 公開(公告)號(hào): | CN113033638A | 公開(公告)日: | 2021-06-25 |
| 發(fā)明(設(shè)計(jì))人: | 張弘;李旭亮;李亞偉 | 申請(qǐng)(專利權(quán))人: | 蘇州海宸威視智能科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 215316 江蘇省蘇州市昆*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 感受 感知 無(wú)錨點(diǎn)框 目標(biāo) 檢測(cè) 方法 | ||
本發(fā)明公開了一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法,將感受野作為錨點(diǎn)框,具有由23個(gè)卷積層構(gòu)成并且分為三大檢測(cè)單元的網(wǎng)絡(luò);所述三大檢測(cè)單元分別為小尺度目標(biāo)檢測(cè)單元、中等尺度目標(biāo)檢測(cè)單元和大尺寸目標(biāo)檢測(cè)單元;每一個(gè)單元根據(jù)感受野大小選擇兩個(gè)分支進(jìn)行分類與回歸操作,共可以獲得6個(gè)檢測(cè)分支,每?jī)蓚€(gè)分支負(fù)責(zé)對(duì)不同尺度的各自單元目標(biāo)進(jìn)行檢測(cè);其中,分類分支用于確定所檢測(cè)的目標(biāo)是否為所需要的目標(biāo),回歸分支用于獲取目標(biāo)框的位坐標(biāo)信息。這種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法舍棄了傳統(tǒng)的錨點(diǎn)框引入,整體結(jié)構(gòu)簡(jiǎn)單,無(wú)多余分支,相比較傳統(tǒng)的SSD以及FasterRCNN方法,在檢測(cè)進(jìn)度和檢測(cè)速度上都有明顯的優(yōu)勢(shì)。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻圖像處理領(lǐng)域,尤其涉及一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法。
背景技術(shù)
目標(biāo)檢測(cè)技術(shù)在計(jì)算機(jī)視覺(jué)領(lǐng)域中是一項(xiàng)非常具有研究意義的課題,其主要任務(wù)是預(yù)測(cè)物體的位置以及種類。
目前,主流的經(jīng)典檢測(cè)模型無(wú)論是單階段的檢測(cè)模型,如SSD,YOLO目標(biāo)檢測(cè)算法,還是兩階段的檢測(cè)模型,如Faster R-CNN等,都是基于一系列預(yù)先設(shè)置好超參數(shù)的錨點(diǎn)框,通過(guò)在不同特征層上設(shè)置不同的尺度的錨點(diǎn)框,實(shí)現(xiàn)更高的概率出現(xiàn)對(duì)于目標(biāo)物體有良好匹配度的目標(biāo)框。
但是,基于錨點(diǎn)框設(shè)置的目標(biāo)檢測(cè)方法卻有面臨著以下挑戰(zhàn):1.錨點(diǎn)框的尺度設(shè)計(jì)無(wú)法完全覆蓋所有的目標(biāo)檢測(cè)物體,每遇到一個(gè)全新的數(shù)據(jù)集都需要根據(jù)數(shù)據(jù)集的特點(diǎn)重新設(shè)置錨點(diǎn)框的數(shù)量和縱橫比,限制了檢測(cè)模型的通用性和魯棒性;2.將錨點(diǎn)框與真實(shí)框進(jìn)行匹配是依賴于IoU參數(shù)的設(shè)置決定的,其閾值往往是依據(jù)經(jīng)驗(yàn)設(shè)定;3.根據(jù)針對(duì)不同尺寸的目標(biāo)檢測(cè)物體設(shè)置的錨點(diǎn)框的數(shù)量,往往會(huì)增加冗余計(jì)算,計(jì)算耗時(shí)等等;4.過(guò)多設(shè)置的錨點(diǎn)框在實(shí)際處理中會(huì)被標(biāo)注為負(fù)樣本,增加了正負(fù)樣本數(shù)量上的不均衡,影響分類器的訓(xùn)練。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是,提供一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法,其舍棄了傳統(tǒng)的錨點(diǎn)框引入,整體結(jié)構(gòu)更簡(jiǎn)單,無(wú)多余分支,檢測(cè)進(jìn)度和檢測(cè)速度更為明顯。
為了解決上述技術(shù)問(wèn)題,本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法,將感受野作為錨點(diǎn)框,具有由23個(gè)卷積層構(gòu)成并且分為三大檢測(cè)單元的網(wǎng)絡(luò);所述三大檢測(cè)單元分別為小尺度目標(biāo)檢測(cè)單元、中等尺度目標(biāo)檢測(cè)單元和大尺寸目標(biāo)檢測(cè)單元;每一個(gè)單元根據(jù)感受野大小選擇兩個(gè)分支進(jìn)行分類與回歸操作,共可以獲得6個(gè)檢測(cè)分支,每?jī)蓚€(gè)分支負(fù)責(zé)對(duì)不同尺度的各自單元目標(biāo)進(jìn)行檢測(cè);其中,分類分支用于確定所檢測(cè)的目標(biāo)是否為所需要的目標(biāo),回歸分支用于獲取目標(biāo)框的位坐標(biāo)信息。
進(jìn)一步地,所述網(wǎng)絡(luò)總體由3×3卷積核、1×1卷積核、ReLu激活函數(shù)以及殘差邊連接構(gòu)成。
進(jìn)一步地,所述感受野的計(jì)算公式如下:
其中,lk-1為第k-1層對(duì)應(yīng)的感受野大小,fk為第k層的卷積核大小;根據(jù)上述公式可以得到所提出的檢測(cè)框架各個(gè)卷積層對(duì)應(yīng)的感受野大小,通過(guò)數(shù)據(jù)增廣方法增加光噪聲、更改亮度對(duì)比度,隨機(jī)水平翻轉(zhuǎn),其中以0.5的概率對(duì)子圖進(jìn)行隨機(jī)翻轉(zhuǎn),通過(guò)損失函數(shù)根據(jù)損失值對(duì)負(fù)樣本排序,以正負(fù)樣本1:10的比例選取排名靠前的負(fù)樣本。
進(jìn)一步地,所述損失函數(shù)是分類損失和回歸損失的加權(quán)和。
進(jìn)一步地,所述分類損失采用交叉熵?fù)p失,所述交叉熵?fù)p失函數(shù)公式如下:
其中,H為交叉熵的計(jì)算值,即損失的計(jì)算值;p為真實(shí)概率分布,即分類函數(shù)的預(yù)測(cè)概率值;q為非真實(shí)概率分布,即分類函數(shù)的預(yù)測(cè)概率值的補(bǔ)集;i為每一個(gè)類別的下標(biāo)。
進(jìn)一步地,所述回歸損失采用Smooth L1損失函數(shù),其公式如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州海宸威視智能科技有限公司,未經(jīng)蘇州海宸威視智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110280998.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無(wú)線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點(diǎn)和感知節(jié)點(diǎn)
- 感知無(wú)線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點(diǎn)和匯聚中心
- 感知無(wú)線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點(diǎn)
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫(kù)
- 基于認(rèn)知數(shù)據(jù)庫(kù)和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動(dòng)駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置
- 圖像處理方法和裝置
- 一種圖像質(zhì)量評(píng)估方法及裝置
- 一種小尺度密集行人檢測(cè)方法
- 錨點(diǎn)框確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 車輛檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于改進(jìn)錨框的高光譜多目標(biāo)檢測(cè)方法
- 一種目標(biāo)檢測(cè)方法及裝置、存儲(chǔ)介質(zhì)
- 人臉及其特征點(diǎn)的檢測(cè)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種基于感受野感知的無(wú)錨點(diǎn)框目標(biāo)檢測(cè)方法
- 一種基于輕量化卷積的無(wú)錨框目標(biāo)檢測(cè)方法





