[發明專利]一種基于深度學習的行人檢測方法在審
| 申請號: | 202110420061.3 | 申請日: | 2021-04-19 |
| 公開(公告)號: | CN113033478A | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 盧立暉;索婕;王化建;張立華;司鵬程;丁明亮;李磊;張正強 | 申請(專利權)人: | 曲阜師范大學;日照匯聯眾創智能技術研究院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京睿智保誠專利代理事務所(普通合伙) 11732 | 代理人: | 韓迎之 |
| 地址: | 276826 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 行人 檢測 方法 | ||
本發明公開了一種基于深度學習的行人檢測方法,屬于深度學習及行人檢測技術領域,包括以下步驟:基于傳統SSD行人檢測模型采用ResNet、VoVNet,K?means聚類進行優化,解決了SSD算法存在行人密集或遮擋以及行人姿態過小導致的漏檢、誤檢問題,提高了行人檢測的準確性、實時性和小目標行人檢測性能。
技術領域
本發明涉及深度學習及行人檢測技術領域,更具體的說是涉及一種基于深度學習的行人檢測方法。
背景技術
行人檢測是計算機視覺領域中的一個重要研究分支,主要任務是判斷輸入的圖像或視頻序列中是否出現行人,并確定其位置。行人檢測技術廣泛地應用于視頻監控、車輛輔助駕駛、智能機器人等多個領域。
目前,計算機視覺技術飛速發展,行人檢測作為其重要研究領域也得了巨大的進步,逐漸趨于實際應用。隨著深度學習算法在行人檢測中的研究和應用,在卷積神經網絡基礎上衍生出了一系列深度學習行人檢測算法。相比于傳統檢測算法,深度學習算法有更強的魯棒性及泛化能力,能夠更快、更準的檢測到行人目標。得益于行人檢測理論的不斷創新和優化,行人檢測為智能監控、無人駕駛等方面提供了技術支撐,有巨大的應用價值。
但是,實際監控場景中,目前的行人檢測算法人仍存在行人的誤檢和漏檢問題,且容易受到遮擋、行人姿態和尺度變化等因素的影響,檢測性能有待于進一步加強。
因此,如何實現一種基于深度學習的行人檢測方法是本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本發明提供了一種基于深度學習的行人檢測方法,本發明的目的在于針對SSD算法存在行人密集或遮擋以及行人姿態過小導致的漏檢、誤檢和耗費時間較長的問題,對SSD算法進行了優化,提供一種基于深度學習的行人檢測方法,用以提高行人檢測的精度、速度以及小目標行人檢測性能。
為了實現上述目的,本發明采用如下技術方案:
一種基于深度學習的行人檢測方法,包括:
S100:獲取帶有行人目標的樣本數據集,并對所述樣本數據集進行預處理;
S200:搭建SSD行人檢測模型,并對所述SSD行人檢測模型進行優化,得到優化后的SSD行人檢測模型;
S300:將經過所述步驟S100預處理得到的樣本數據集送入優化后的SSD行人檢測模型進行訓練,產生預選框,并經過處理得到檢測框;
S400:利用所述檢測框對所述樣本數據集中的行人目標進行檢測,將所述檢測結果輸出并顯示。
優選的,在進行步驟S300時先對樣本數據集進行K-means聚類,得到所述預選框的最佳寬高比,包括:
S10:設定k個聚類中心,設聚類中心的坐標為(Wi,Hi),計算每個所述預選框和每個聚類中心的距離,并將所述預選框分配給最近的聚類中心,具體表達式為:
d=1-IOU[(xj,yj,wj,hj),(xj,yj,Wj,Hj)]
j∈{1,2,…,N},i∈{1,2,…,k}
其中d為聚類中心距離,(xj,yj,wj,hj)為真實框的對應坐標,IOU為兩框之間的交并比,N是預選框的數量,k為聚類中心點數量;
S20:預選框分配完成之后,重新計算每個簇的聚類中心點,即計算全部所述預選框的寬和高的平均值,具體的表達式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曲阜師范大學;日照匯聯眾創智能技術研究院,未經曲阜師范大學;日照匯聯眾創智能技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110420061.3/2.html,轉載請聲明來源鉆瓜專利網。





