[發明專利]行人檢測網絡及模型訓練方法、檢測方法、介質、設備有效
| 申請號: | 201910198487.1 | 申請日: | 2019-03-15 |
| 公開(公告)號: | CN110008853B | 公開(公告)日: | 2023-05-30 |
| 發明(設計)人: | 胡永健;陳浩;劉琲貝 | 申請(專利權)人: | 華南理工大學;中新國際聯合研究院 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 黃磊 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人 檢測 網絡 模型 訓練 方法 介質 設備 | ||
本發明公開了一種行人檢測網絡,以VGG16為基礎網絡,包括fc6、fc7、conv6_2、conv7_2和conv8_2五個特征層。本發明還公開一種行人檢測網絡模型訓練方法,包括步驟:計算行人框寬高比的期望值E;特征提取,得到置信度圖和坐標偏置圖;制定密集框生成策略;對訓練數據文件進行預處理,訓練行人檢測網絡得到行人檢測網絡模型。本發明還公開了一種行人檢測方法,包括步驟:設置檢測閾值,加載行人檢測網絡模型,初始化網絡參數;將圖片送入模型中,得到檢測結果;將所有的檢測框通過非極大值抑制對重復檢測的框進行濾除,最后將結果保存在文件中。本發明基于密集框生成網絡,有效地克服了現有技術在行人密集場景下漏檢率高等缺點,提升該框架在行人密集場景下的檢測性能。
技術領域
本發明涉及深度學習及行人檢測領域,具體涉及一種密集行人檢測網絡及模型訓練方法、密集行人檢測方法、介質、設備。
背景技術
大數據時代的到來,帶來了重大的時代轉型,從科學研究到醫療保險,從銀行業到互聯網,科技信息技術產業都在不斷的發展。特別是最近幾年,人工智能開始進入人們的視野。人工智能是研究如何用計算機來模擬人腦的思維方式并作出決策的學科,其領域包括智能機器人、計算機視覺、自然語言處理和專家系統等。計算機視覺作為人工智能的一個重要研究領域,一直以來都是學術界和工業界研究的熱點。計算機視覺技術就是教會計算機如何看懂和理解世界,其有很多應用場景。比如智能監控系統、無人駕駛汽車、智能機器人等。其中智能視頻監控系統逐步成為圖像智能分析中的一項重要應用領域和研究方向。
近年來,隨著深度學習研究的火熱,一批基于深度學習的目標檢測方法也相繼出現。2014年Girshick等人在CVPR會議上發表論文《Rich?Feature?Hierarchies?forAccurate?Object?Detection?and?Semantic?Segmentation》,提出了“候選窗口生成+對候選框提取特征分類”的目標檢測兩步法,大大提升了PASCAL?VOC數據集上的檢測精度。雖然R-CNN在精確度上有較大的提升,但是其缺點非常明顯,就是速度較慢。隨后,Girshick等人又于2015年發表論文《Faster?R-CNN:towards?real-time?object?detection?withregion?proposal?networks》,Faster?R-CNN擯棄了之前目標檢測的通用模式(候選窗口生成+對候選框提取特征分類),采取了一種全新的,一種名為RPN(Region?ProposalNetworks)網絡生成候選區域的方法,提升了速度還有候選框的召回率。2016年,Redmon等人在CVPR會議上發表論文《You?Only?Look?Once:Unified,Real-Time?ObjectDetection》,提出YOLO目標檢測方法,該方法使用了回歸的思想,給定輸入圖像,直接在圖像的多個位置上回歸出這個位置的目標邊框以及目標類別,這樣大大提升了目標檢測的速度,但是檢測精度并不是很好。同年,Liu等人在ECCV會議上發表論文《SSD:Single?ShotMultiBox?Detector》,其在YOLO模型的基礎上進行改進,提升了檢測精度的同時,保持了實時檢測的速度要求。針對密集行人檢測,Felzenszwalb提出的一種基于可變形部件模型(Deformable?Part?Model,DPM)的目標檢測算法,由于可變部件模型的使用,該算法對于目標的形變問題具有很強的魯棒性,目前已成為眾多檢測器、人體姿態、圖像分割和行為分類的重要部分。但是,DPM是手工設計的特征,目前很多針對密集行人檢測的方法也還是停留在傳統手工特征和手工特征與卷積神經網絡相結合的方法,相較于深度學習的方法,顯得檢測性能不足,而Faster?R-CNN、YOLO、SSD等目標檢測算法直接用于密集檢測也存在性能下降的問題。究其原因,是因為密集行人出現的場景下,行人之間相互遮擋,不同行人之間的特征存在太多相似性,會影響檢測器的判斷。
發明內容
本發明提供一種行人檢測網絡及模型訓練方法、檢測方法、介質、設備,該行人檢測方法為基于密集框生成網絡的密集行人檢測方法,有效地克服了現有技術在行人密集場景下漏檢率高等缺點,提升該框架在行人密集場景下的檢測性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學;中新國際聯合研究院,未經華南理工大學;中新國際聯合研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910198487.1/2.html,轉載請聲明來源鉆瓜專利網。





