[發明專利]一種快速行人檢測方法及裝置有效
| 申請號: | 201810069322.X | 申請日: | 2018-01-24 |
| 公開(公告)號: | CN108399362B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 林倞;尹森堂;張冬雨;王青 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 廣州容大知識產權代理事務所(普通合伙) 44326 | 代理人: | 劉新年 |
| 地址: | 510000 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 快速 行人 檢測 方法 裝置 | ||
本發明公開了一種快速行人檢測方法及裝置,所述方法包括如下步驟:步驟S1,構建可配置的基于卷積神經網絡的深度模型,利用訓練樣本學習出構建的網絡參數,獲得用于測試過程的模型;步驟S2,輸入測試樣本,通過訓練好的模型利用神經網絡感知域的變化規律使用不同的中間層對不同尺度范圍內的目標物體進行檢測,預測出圖像中目標物體的框圖,本發明通過利用神經網絡感知域的變化規律,使用不同的中間層對特定尺度范圍內的目標物體進行檢測,更好的適應了感知域與物體大小的關系,有效提高了檢測結果。
技術領域
本發明涉及行人檢測技術領域,特別是涉及一種基于深度學習的面向嵌入式系統的快速行人檢測方法及裝置。
背景技術
作為計算機視覺中目標檢測的一部分,行人檢測在現實世界的應用有著重要意義,隨著圖像采集技術的成熟與存儲技術成本的下降,越來越多的攝像機被部署在公共場所,另一方面,隨著自動駕駛、智能交通的推行,車載攝像頭也產生了海量的視頻資源。傳統的人工篩選和處理,不僅效率低下,耗費大量人力物力,而且可能引入一些人為因素,導致一些偏差。近年來,深度學習在計算機視覺領域取得前所未有的突破,不僅效率遠勝人力,準確度在很多領域也超過人類。因此,有效利用深度學習的方法進行行人檢測的課題備受關注。
人是視頻監控或自動駕駛中最主要的目標之一,而行人檢測的首要任務就是識別人體的存在,并提供相應的標注信息。由于在現實世界中捕捉到的圖像質量參差不齊,對于小物體、遮擋的物體的檢測一直是行人檢測的難點,另一方面,車載攝像頭也經常會捕捉到一些模糊的圖像,這樣的圖像中也存在大量類似行人卻不是行人的物體。而具體到嵌入式系統,由于識別能力強的大型神經網絡模型通常難以有效率的運行在計算資源有限的嵌入式設備上,而對于嵌入式設備的應用需求又是實時的,因此兼顧檢測準確率和效率是面向嵌入式系統的快速行人檢測的重中之重。
發明內容
為克服上述現有技術存在的不足,本發明之一目的在于提供一種快速行人檢測方法及裝置,通過利用神經網絡感知域的變化規律,使用不同的中間層對特定尺度范圍內的目標物體進行檢測,更好的適應了感知域與物體大小的關系,有效提高了檢測結果。
本發明之另一目的在于提供一種快速行人檢測方法及裝置,通過調整并訓練VGG-16的網絡得到適應嵌入式系統要求的squeeze VGG-16網絡,有效降低了網絡模型的參數量并加快了計算效率。
本發明之再一目的在于提供一種快速行人檢測方法及裝置,通過去卷積的方法對特定網絡層的特征圖進行放大,增強了對小物體的檢測,相比于傳統圖片放大的方法,幾乎不增加顯存和計算量。
本發明之又一目的在于提供一種快速行人檢測方法及裝置,通過使用目標對象1.5倍大小的區域作為背景語義特征增加到網絡中,對于模糊物體和遠距離小物體的檢測,有著極佳的性能。
為達上述及其它目的,本發明提出一種快速行人檢測方法,包括如下步驟:
步驟S1,構建可配置的基于卷積神經網絡的深度模型,利用訓練樣本學習出構建的網絡參數,獲得用于測試過程的模型;
步驟S2,輸入測試樣本,通過訓練好的模型利用神經網絡感知域的變化規律使用不同的中間層對不同尺度范圍內的目標物體進行檢測,預測出圖像中目標物體的框圖。
優選地,步驟S1進一步包括:
構建可配置的基于卷積神經網絡的深度模型;
輸入訓練樣本;
初始化卷積神經網絡及其參數,包括網絡層中每層連接的權重和偏置;
采用前向傳播算法和后向傳播算法,利用訓練樣本學習出構建的網絡參數,即用于測試過程的模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810069322.X/2.html,轉載請聲明來源鉆瓜專利網。





