[發(fā)明專利]一種融合圖像預(yù)處理與深度學(xué)習(xí)目標檢測的人頭檢測方法在審
| 申請?zhí)枺?/td> | 202010116670.5 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111339934A | 公開(公告)日: | 2020-06-26 |
| 發(fā)明(設(shè)計)人: | 李好洋;黃家名;秦瑜恒;周小芹 | 申請(專利權(quán))人: | 河海大學(xué)常州校區(qū) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/40;G06N3/08;G06N3/04 |
| 代理公司: | 南京縱橫知識產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 張倩倩 |
| 地址: | 213022 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 融合 圖像 預(yù)處理 深度 學(xué)習(xí) 目標 檢測 人頭 方法 | ||
本發(fā)明公開一種融合圖像預(yù)處理與深度學(xué)習(xí)目標檢測的快速精確的人頭檢測方法,方法包括:實時獲取監(jiān)控圖像數(shù)據(jù);對獲取到的監(jiān)控圖像數(shù)據(jù)進行預(yù)處理;將預(yù)處理后的監(jiān)控圖像數(shù)據(jù)輸入至預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò),得到監(jiān)控圖像數(shù)據(jù)中的待選區(qū)域anchor及其對應(yīng)的偏移值與置信度;根據(jù)神經(jīng)網(wǎng)絡(luò)輸出的anchor的置信度,選擇存在目標的anchor;根據(jù)神經(jīng)網(wǎng)絡(luò)輸出的anchor的偏移值,計算對應(yīng)相應(yīng)目標的預(yù)測邊界框的位置和大小;將預(yù)測邊界框按照其位置和大小在監(jiān)控圖像數(shù)據(jù)中畫出,即得到結(jié)果圖像;輸出結(jié)果圖像以及圖像中檢測到的人頭數(shù)量,所述人頭數(shù)量即為圖像中預(yù)測邊界框的數(shù)量。利用本發(fā)明的人頭檢測方法能夠提高公共場合人頭檢測的快速準確性。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺技術(shù)領(lǐng)域,特別是一種融合圖像預(yù)處理與深度學(xué)習(xí)目標檢測的快 速精確人頭檢測方法。
背景技術(shù)
在大量公共場合中,比如大型商場超市、旅游景區(qū)、大小交通樞紐、銀行、地鐵和學(xué)校 等,都需要對監(jiān)控攝像中的人數(shù)密集度進行實時分析,以保障公共場合有序穩(wěn)定運行。比如 對大型商場進行人數(shù)實時統(tǒng)計分析,方便決策者對過于擁擠的區(qū)域進行及時疏導(dǎo),防止踩踏 事故的出現(xiàn)。同時該技術(shù)也可以應(yīng)用在校園場景中,實時監(jiān)控分析每個教室的人數(shù),對學(xué)生 來講,可以根據(jù)實時提供的教室人數(shù)信息更加快速地找到合適的自習(xí)教室,減少了尋找自習(xí) 教室所需的時間。對于教師來講,此方法可以幫助教師合理分配教學(xué)資源,從而提高教學(xué)質(zhì) 量。可以看到,準確實時地計算公共場合的人流量有著良好的應(yīng)用前景以及商業(yè)價值。然而, 目前針對多場景的人數(shù)統(tǒng)計研究面臨一些挑戰(zhàn),比如說圖像中待統(tǒng)計的行人分辨率較低,人 群相互遮擋嚴重且擁擠等問題。
目前對于人群計數(shù)主要有兩種實現(xiàn)路徑:基于特征回歸的人數(shù)統(tǒng)計方法和基于目標檢測 的人數(shù)統(tǒng)計方法,這兩種方法都涉及了有監(jiān)督的深度學(xué)習(xí)技術(shù)。一種是直接使用回歸的思路, 根據(jù)圖像回歸出擁擠人群密度熱圖,但它的缺點是只能得到場景整體的一個擁擠指數(shù),不能 獲知人群中每個個體的具體位置,同時這種方法對圖像分辨率很敏感,不利于多場景切換使 用。另一種是使用主流的目標檢測方法,例如使用Faster R-CNN或SSD等技術(shù)檢測“人”所 在的位置,從而得出圖像中“人”的數(shù)量。這種方法的缺點是在人物相互遮擋或者光線不足 的情況下性能較差,而人群越擁擠相互遮擋的可能性越大,導(dǎo)致算法使用受限。除此之外, 這些目標檢測算法并沒有針對“人頭檢測”這一任務(wù)進行優(yōu)化,導(dǎo)致算法在檢測較低分辨率 的目標時,誤檢率和漏檢率較高。
且由于目前監(jiān)控設(shè)備硬件條件的限制,無論是網(wǎng)絡(luò)攝像頭還是有線攝像頭,監(jiān)控視頻圖 像普遍存在模糊且噪聲不穩(wěn)定的情況。
發(fā)明內(nèi)容
本發(fā)明的目的是,提供一種融合圖像預(yù)處理與深度學(xué)習(xí)目標檢測的人頭檢測方法,能夠 提高公共場合人頭檢測的快速準確性。
本發(fā)明采取的技術(shù)方案為:一種人頭檢測方法,包括:
實時獲取監(jiān)控圖像數(shù)據(jù);
對獲取到的監(jiān)控圖像數(shù)據(jù)進行預(yù)處理;
將預(yù)處理后的監(jiān)控圖像數(shù)據(jù)輸入至預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò),得到監(jiān)控圖像數(shù)據(jù)中的待選區(qū) 域anchor及其對應(yīng)的偏移值與置信度;所述神經(jīng)網(wǎng)絡(luò)為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),其訓(xùn)練樣本為根 據(jù)圖像數(shù)據(jù)中待選區(qū)域anchor與人頭標定區(qū)域ground-truth的交并比選擇出anchor正負樣 本,且正樣本具有偏移標簽和置信度標簽,負樣本具有置信度標簽的圖像數(shù)據(jù)集;
根據(jù)神經(jīng)網(wǎng)絡(luò)輸出的anchor的置信度,選擇存在目標的anchor;
根據(jù)神經(jīng)網(wǎng)絡(luò)輸出的anchor的偏移值,計算對應(yīng)相應(yīng)目標的預(yù)測邊界框的位置和大小;
將預(yù)測邊界框按照其位置和大小在監(jiān)控圖像數(shù)據(jù)中畫出,即得到結(jié)果圖像;
輸出結(jié)果圖像以及圖像中檢測到的人頭數(shù)量,所述人頭數(shù)量即為圖像中預(yù)測邊界框的數(shù) 量。
可選的,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河海大學(xué)常州校區(qū),未經(jīng)河海大學(xué)常州校區(qū)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010116670.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





