[發明專利]一種融合圖像預處理與深度學習目標檢測的人頭檢測方法在審
| 申請號: | 202010116670.5 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN111339934A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 李好洋;黃家名;秦瑜恒;周小芹 | 申請(專利權)人: | 河海大學常州校區 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/40;G06N3/08;G06N3/04 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 張倩倩 |
| 地址: | 213022 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 圖像 預處理 深度 學習 目標 檢測 人頭 方法 | ||
1.一種人頭檢測方法,其特征是,包括:
實時獲取監控圖像數據;
對獲取到的監控圖像數據進行預處理;
將預處理后的監控圖像數據輸入至預先訓練的神經網絡,得到監控圖像數據中的待選區域anchor及其對應的偏移值與置信度;所述神經網絡為深度學習神經網絡,其訓練樣本為根據圖像數據中待選區域anchor與人頭標定區域ground-truth的交并比選擇出anchor正負樣本,且正樣本具有偏移標簽和置信度標簽,負樣本具有置信度標簽的圖像數據集;
根據神經網絡輸出的anchor的置信度,選擇存在目標的anchor;
根據神經網絡輸出的anchor的偏移值,計算對應相應目標的預測邊界框的位置和大小;
將預測邊界框按照其位置和大小在監控圖像數據中畫出,即得到結果圖像;
輸出結果圖像以及圖像中檢測到的人頭數量,所述人頭數量即為圖像中預測邊界框的數量。
2.根據權利要求1所述的方法,其特征是,神經網絡的訓練步驟包括:
采集多個歷史監控圖像,組成圖像數據集;
對圖像數據集中的各監控圖像進行標注,標注出圖像中所有人頭的位置信息作為人頭標定區域ground-truth;
確定神經網絡所使用的anchor的大小;
對于各監控圖像,分別選擇用于訓練的anchor正負樣本;
對于各選出的正負樣本,分別生成訓練所需的標簽,正樣本標簽包括偏移值標簽和置信度標簽,負樣本標簽包括置信度標簽;
搭建神經網絡模型,配置神經網絡模型參數,使用Adam優化器,設計損失函數;
將監控圖像數據輸入神經網絡,利用圖像對應的偏移值標簽和置信度標簽計算損失函數,使用優化器對損失函數的參數進行反向傳播,優化模型參數。
3.根據權利要求1或2所述的方法,其特征是,神經網絡的神經網絡層采用卷積層,池化層由步長為2的卷積核代替,利用上采樣和融合機制,最終生成兩個大小不同的特征圖用于目標檢測。
4.根據權利要求3所述的方法,其特征是,anchor的大小計算公式為:
anchor_size=layer_stride*aspect_ratio*anchor_scale
其中,layer_stride為下采樣的倍數,aspect_ratio為anchor的寬高比,anchor_scale為anchor在特征圖上的尺度scale。
5.根據權利要求4所述的方法,其特征是,對于40*30的大特征圖,下采樣倍數layer_stride為16,aspect_ratio設為1,anchor_scale設置為2和4;對于10*8的小特征圖,layer_stride為64,aspect_ratio為1,anchor_scale為2和4。
6.根據權利要求2所述的方法,其特征是,所述選擇用于訓練的anchor正負樣本為:
將ground-truth與anchor的交并比大于等于0.7的anchor,或ground-truth與anchor具有最大交并比的anchor標記為正樣本;
將ground-truth與anchor的交并比小于等0.3的anchor標記為負樣本;
正負樣本數量的比例為1:1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學常州校區,未經河海大學常州校區許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010116670.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像匹配方法、裝置、設備及存儲介質
- 下一篇:圖像噪聲點的判斷方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





