[發(fā)明專(zhuān)利]一種具有遮擋處理的快速人體目標(biāo)檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201711121852.6 | 申請(qǐng)日: | 2017-11-14 |
| 公開(kāi)(公告)號(hào): | CN107909027B | 公開(kāi)(公告)日: | 2020-08-11 |
| 發(fā)明(設(shè)計(jì))人: | 周雪;徐雨亭;鄒見(jiàn)效;徐紅兵 | 申請(qǐng)(專(zhuān)利權(quán))人: | 電子科技大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 成都行之專(zhuān)利代理事務(wù)所(普通合伙) 51220 | 代理人: | 溫利平 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 具有 遮擋 處理 快速 人體 目標(biāo) 檢測(cè) 方法 | ||
本發(fā)明公開(kāi)了一種具有遮擋處理的快速人體目標(biāo)檢測(cè)方法,在現(xiàn)有人體目標(biāo)檢測(cè)區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,進(jìn)一步對(duì)實(shí)時(shí)采集并檢測(cè)得到的人體目標(biāo)檢測(cè)框的融合進(jìn)行改進(jìn),采用帶有放回采樣策略的非極大值抑制算法,這樣使得人體目標(biāo)的檢測(cè)對(duì)閾值具有不敏感性,可有效避免人體目標(biāo)的漏檢和重復(fù)檢測(cè),從而很好地以解決兩個(gè)靠得很近即存在部分遮擋的人體目標(biāo)檢測(cè)。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺(jué)、模式識(shí)別、機(jī)器學(xué)習(xí)等技術(shù)領(lǐng)域,更為具體地講,涉及在監(jiān)控場(chǎng)景下一種基于區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)的、具有遮擋處理的快速人體目標(biāo)檢測(cè)方法。
背景技術(shù)
近年來(lái),隨著科技的進(jìn)步,各個(gè)行業(yè)開(kāi)始越來(lái)越關(guān)注安全問(wèn)題。在銀行、機(jī)場(chǎng)、地鐵、車(chē)站、小區(qū)等重要區(qū)域以及公共場(chǎng)所,人們都安裝了監(jiān)控?cái)z像頭進(jìn)行視頻監(jiān)控。這些監(jiān)控?cái)z像頭一般都安裝在較高的位置,以俯視的角度進(jìn)行監(jiān)控。而我們所說(shuō)的監(jiān)控場(chǎng)景即是指在這種情景下拍攝的監(jiān)控畫(huà)面。
一般情況下,人是監(jiān)控場(chǎng)景的主體,對(duì)人體目標(biāo)的跟蹤和后續(xù)的行為識(shí)別分析嚴(yán)重依賴(lài)于人體目標(biāo)檢測(cè)的精度,因此如何在監(jiān)控場(chǎng)景下準(zhǔn)確檢測(cè)人體目標(biāo)已經(jīng)成為學(xué)術(shù)界和工業(yè)界廣泛關(guān)注的熱點(diǎn)之一。
早期的研究者一般將人體目標(biāo)檢測(cè)問(wèn)題分為兩個(gè)步驟來(lái)解決,首先是基于手工設(shè)計(jì)的模型進(jìn)行特征提取,然后基于目標(biāo)特征設(shè)計(jì)分類(lèi)器訓(xùn)練檢測(cè)模型。比如,Dalal N與Triggs B提出了一種基于梯度直方圖(Histograms of Oriented Gradients,HOG)特征和支持向量機(jī)(Support Vector Machine,SVM)框架的人體目標(biāo)檢測(cè)方法,具體算法原理參見(jiàn):Dalal N,Triggs B.Histograms of oriented gradients for human detection[C].Computer Vision and Pattern Recognition,2005.CVPR 2005.IEEE Computer SocietyConference on.IEEE,2005,1:886-893。Shanshan Zhang和Rodrigo Benenson采用梯度直方圖(HOG)和顏色空間變換(LUV)提取特征,用提升決策樹(shù)(Boosted Decision Tree)訓(xùn)練人體目標(biāo)分類(lèi)器。具體算法原理參見(jiàn):Shanshan Zhang,Rodrigo Benenson,and BerntSchiele.Filtered channel features for pedestrian detection[C].Computer Visionand Pattern Recognition,2015.CVPR 2015:1751-1760。這些方法在簡(jiǎn)單監(jiān)控場(chǎng)景下對(duì)人體目標(biāo)檢測(cè)取得了較好的結(jié)果,但是對(duì)于復(fù)雜的監(jiān)控場(chǎng)景下的人體目標(biāo)檢測(cè)結(jié)果還是不能滿(mǎn)足我們的實(shí)際需求,而且該類(lèi)傳統(tǒng)算法的檢測(cè)速度較慢,遠(yuǎn)遠(yuǎn)達(dá)不到實(shí)時(shí)檢測(cè)的要求。
隨著最近幾年深度學(xué)習(xí)的興起,基于深度學(xué)習(xí)的方法在圖像分類(lèi)領(lǐng)域取得了優(yōu)異的成績(jī)。很多研究者基于此也嘗試將深度學(xué)習(xí)應(yīng)用于目標(biāo)檢測(cè)領(lǐng)域。Ren,Shaoqing提出了一種快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(Faster R-RCNN)的方法,將人體目標(biāo)檢測(cè)問(wèn)題分為三個(gè)階段,首先是獲取人體目標(biāo)區(qū)域候選框,然后是使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)特征提取,最后對(duì)目標(biāo)特征進(jìn)行分類(lèi)訓(xùn)練得到模型。相較于傳統(tǒng)的人體目標(biāo)檢測(cè)方法,提高了57%的檢測(cè)準(zhǔn)確率。具體算法原理可以參見(jiàn)文獻(xiàn):Ren,Shaoqing,et al.Faster R-CNN:Towards real-timeobject detection with region proposal networks.Advances in neural informationprocessing systems.2015。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711121852.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





