[發(fā)明專利]使用高斯懲罰檢測圖像中行人的方法在審
| 申請?zhí)枺?/td> | 201710474582.0 | 申請日: | 2017-06-21 |
| 公開(公告)號: | CN109101859A | 公開(公告)日: | 2018-12-28 |
| 發(fā)明(設(shè)計(jì))人: | 王文敏;董培磊;范夢迪;王榮剛;李革;董勝富;王振宇;李英;趙輝;高文 | 申請(專利權(quán))人: | 北京大學(xué)深圳研究生院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京萬象新悅知識產(chǎn)權(quán)代理有限公司 11360 | 代理人: | 黃鳳茹 |
| 地址: | 518055 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 邊界框 行人檢測 高斯 懲罰 置信度 遮擋 訓(xùn)練數(shù)據(jù)集 檢測圖像 圖像 檢測 篩選 測試數(shù)據(jù)集 檢出率 漏檢率 去除 標(biāo)注 重復(fù) 保留 | ||
1.一種使用高斯懲罰檢測圖像中行人的方法,在行人檢測過程中,使用高斯懲罰對獲得的初步行人邊界框進(jìn)行篩選,從而提升對圖像中行人尤其是遮擋行人的檢測性能;包括如下步驟:
1)獲取行人檢測圖像的訓(xùn)練數(shù)據(jù)集、測試數(shù)據(jù)集和行人標(biāo)注;
2)使用行人檢測方法用訓(xùn)練數(shù)據(jù)集訓(xùn)練得到檢測模型,獲取初步的行人邊界框的坐標(biāo)及其置信度(score);
3)對行人邊界框的置信度進(jìn)行高斯懲罰,得到懲罰后的行人邊界框置信度;通過行人邊界框篩選得到最終的行人邊界框,從而達(dá)到去除單個行人的重復(fù)邊界框,而保留被遮擋行人的邊界框的目的,由此實(shí)現(xiàn)對圖像中行人的檢測;包括如下步驟:
31)對于每一幅圖像,根據(jù)置信度對邊界框進(jìn)行排序,選擇置信度最大的邊界框M;
32)通過式1計(jì)算其他每一個邊界框bboxi與邊界框M的重疊度IoU(M,bboxi):
其中,area(M∩bboxi)是邊界框bboxi與M的區(qū)域交集,area(M∪bboxi)是邊界框bboxi與M的區(qū)域并集;
通過式3對邊界框的置信度進(jìn)行懲罰,得到懲罰后的行人邊界框置信度:
其中,e為自然對數(shù),σ是方差;scorei為初始邊界框的置信度;Si為邊界框bboxi懲罰后的置信度;IoU(M,bboxi)是邊界框bboxi與M的重疊度;
33)設(shè)置置信度閾值,對每張圖像,將懲罰后的置信度大于所設(shè)置的置信度閾值的行人邊界框,作為最終檢測結(jié)果;由此檢測得到圖像中的行人。
2.如權(quán)利要求1所述方法,其特征是,步驟1)具體從行人數(shù)據(jù)集Caltech中分別得到訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)均有行人標(biāo)注,所述行人標(biāo)注采用矩形框在圖像中的左上角和右下角的坐標(biāo)來表示行人在圖像中的位置。
3.如權(quán)利要求1所述方法,其特征是,步驟2)具體采用文獻(xiàn)[1](S.Ren,K.He,R.Girshick,and J.Sun,“Faster R-CNN:Towards Real-Time Object Detection withRegion Proposal Networks,”,TPAMI(2016))記載的檢測模型Faster RCNN進(jìn)行訓(xùn)練,利用訓(xùn)練數(shù)據(jù)集的圖像對Faster RCNN神經(jīng)網(wǎng)絡(luò)的全連接層進(jìn)行微調(diào);將訓(xùn)練圖像和標(biāo)注信息輸入Faster RCNN神經(jīng)網(wǎng)絡(luò)中,通過反向傳播算法將模型檢測和標(biāo)注之間的差異損失回饋到模型中,并調(diào)整網(wǎng)絡(luò)模型的參數(shù);在訓(xùn)練數(shù)據(jù)集上多次迭代后,獲得行人檢測模型;再將測試數(shù)據(jù)集輸入行人的檢測模型,對行人的位置進(jìn)行分類和定位,由此獲得初步的行人邊界框及其置信度和坐標(biāo)。
4.如權(quán)利要求1所述方法,其特征是,步驟33)設(shè)置置信度閾值為0.5。
5.如權(quán)利要求1所述方法,其特征是,步驟2)所述獲取的初步的行人邊界框類別包括:行人邊界框之間完全沒有重疊的邊界框、單個行人邊界框、遮擋行人間的邊界框。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué)深圳研究生院,未經(jīng)北京大學(xué)深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710474582.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:動作識別方法及裝置
- 下一篇:電子設(shè)備及其手勢識別方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 利用多個高斯模型以維持圖像背景的方法與裝置
- 擴(kuò)展的切片高斯混合濾波器
- 產(chǎn)生拉蓋爾-高斯關(guān)聯(lián)的部分相干高斯光束的系統(tǒng)和方法
- 一種脈沖焊接方法
- 產(chǎn)生雙指數(shù)貝塞爾高斯光束的方法及系統(tǒng)
- 一種適用于連續(xù)變量量子密鑰分發(fā)系統(tǒng)的高斯調(diào)制數(shù)據(jù)生成方法
- 一種基于多變量對數(shù)高斯混合模型的圖像紋理特征提取及識別方法
- 一種基于卷積稀疏編碼的高斯束偏移方法
- 一種應(yīng)用于非高斯噪聲環(huán)境下的移動機(jī)器人狀態(tài)估計(jì)方法
- 一種非高斯噪聲條件下的單站純角度目標(biāo)定位與跟蹤方法





