[發(fā)明專利]基于分塊遮擋感知的行人檢測方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201810393658.1 | 申請日: | 2018-04-27 |
| 公開(公告)號: | CN108898047B | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計)人: | 雷震;張士峰;莊楚斌 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京市恒有知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11576 | 代理人: | 郭文浩 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 分塊 遮擋 感知 行人 檢測 方法 系統(tǒng) | ||
本發(fā)明屬于模式識別技術(shù)領(lǐng)域,具體涉及一種基于分塊遮擋感知的行人檢測方法及系統(tǒng),旨在解決行人被遮擋而造成的行人檢測準確率較低的技術(shù)問題。為此目的,本發(fā)明中的行人檢測方法包括:基于預(yù)先構(gòu)建的行人檢測模型,并根據(jù)待測行人圖像,獲取每個預(yù)設(shè)的人體檢測區(qū)域?qū)?yīng)的圖像特征;對所獲取的圖像特征進行特征融合,得到對應(yīng)行人的整體特征;根據(jù)整體特征,獲取待測行人圖像的多個檢測結(jié)果框;選取所獲取的多個所述檢測結(jié)果框中滿足預(yù)設(shè)的篩選條件的檢測結(jié)果框。基于上述步驟,能夠有效檢測出待測圖像中被遮擋的行人。同時,本發(fā)明中的行人檢測系統(tǒng)能夠執(zhí)行并實現(xiàn)上述方法。
技術(shù)領(lǐng)域
本發(fā)明屬于模式識別技術(shù)領(lǐng)域,具體涉及一種基于分塊遮擋感知的行人檢測方法及系統(tǒng)。
背景技術(shù)
行人檢測技術(shù)是一種在任意輸入圖像中自動搜索行人的位置和大小的技術(shù),其廣泛應(yīng)用于的計算機視覺和模式識別等領(lǐng)域,例如自動駕駛、視頻監(jiān)控和生物特征識別等。
在現(xiàn)實生活中的復(fù)雜環(huán)境下,行人的遮擋問題是目前行人檢測面臨的最大挑戰(zhàn)之一,尤其是在擁擠場景下,如何進行高效且精準的行人檢測更是研究的熱點與難點。針對該問題,目前大多數(shù)行人檢測方法都使用基于分塊的模型,通過學(xué)習(xí)一系列分塊檢測器,并綜合每個檢測器的結(jié)果用于對行人進行最終定位。但這些方法只是要求每個預(yù)測的檢測窗口盡可能接近于行人標注框,而沒有考慮到它們之間的內(nèi)在聯(lián)系。因此,這些行人檢測器的性能對于非極大值抑制法(Non Maximum Suppression)閾值的設(shè)置非常敏感,尤其是對于存在大規(guī)模擁擠的場景,非極大值抑制法閾值對檢測器性能的影響更大。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中的上述問題,即為了解決行人被遮擋而造成的行人檢測準確率較低的技術(shù)問題,本發(fā)明的一方面,提供了一種基于分塊遮擋感知的行人檢測方法,包括:
基于預(yù)先構(gòu)建的行人檢測模型,并根據(jù)待測行人圖像,獲取每個預(yù)設(shè)的人體檢測區(qū)域?qū)?yīng)的圖像特征;
對所獲取的圖像特征進行特征融合,得到對應(yīng)行人的整體特征;
根據(jù)所述整體特征,獲取所述待測行人圖像的多個檢測結(jié)果框;
選取所獲取的多個所述檢測結(jié)果框中滿足預(yù)設(shè)的篩選條件的檢測結(jié)果框;
其中,所述行人檢測模型是基于Faster R-CNN神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型,并且所述Faster R-CNN神經(jīng)網(wǎng)絡(luò)的高卷積層中關(guān)聯(lián)有錨點框。
進一步地,在“基于預(yù)先構(gòu)建的行人檢測模型,并根據(jù)待測行人圖像,獲取每個預(yù)設(shè)的人體檢測區(qū)域?qū)?yīng)的圖像特征”之前,所述方法還包括:
對所述預(yù)設(shè)的訓(xùn)練圖像進行數(shù)據(jù)增廣處理,得到訓(xùn)練樣本;
對錨點框與所述訓(xùn)練樣本中的行人標注框進行匹配,并根據(jù)匹配結(jié)果將錨點框劃分為正樣本和負樣本;所述正樣本為與行人標注框匹配的錨點框,所述負樣本為與行人標注框未匹配的錨點框;
采用困難負樣本挖掘方法選取預(yù)設(shè)的第一數(shù)量的負樣本;
根據(jù)所述正樣本與所選取的負樣本計算損失函數(shù)值,并根據(jù)損失函數(shù)值更新所述Faster R-CNN神經(jīng)網(wǎng)絡(luò);對更新后的Faster R-CNN神經(jīng)網(wǎng)絡(luò)重新進行網(wǎng)絡(luò)訓(xùn)練,直至其滿足預(yù)設(shè)的收斂條件。
進一步地,所述Faster R-CNN神經(jīng)網(wǎng)絡(luò)包括RPN模塊;在“基于預(yù)先構(gòu)建的行人檢測模型,并根據(jù)待測行人圖像,獲取每個預(yù)設(shè)的人體檢測區(qū)域?qū)?yīng)的圖像特征”之前,所述方法還包括:
基于預(yù)設(shè)的訓(xùn)練圖像,并按照下式所示的損失函數(shù),對所述RPN模塊進行網(wǎng)絡(luò)訓(xùn)練:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810393658.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于策略的業(yè)務(wù)感知模型及感知方法
- 一種基于分區(qū)感知的無線通信系統(tǒng)頻譜感知方法
- 確定空閑頻段的方法和系統(tǒng)、中心節(jié)點和感知節(jié)點
- 感知無線網(wǎng)絡(luò)的共享協(xié)作頻譜感知方法、感知節(jié)點和匯聚中心
- 感知無線網(wǎng)絡(luò)的協(xié)作頻譜感知方法和感知節(jié)點
- 頻譜感知方法、頻譜感知設(shè)備和數(shù)據(jù)庫
- 基于認知數(shù)據(jù)庫和頻譜感知的頻譜共享方法及裝置
- 一種頂層感知限位組
- 一種自動駕駛汽車用升降式智能感知模塊
- 感知數(shù)據(jù)獲取方法和裝置





