[發明專利]一種視覺目標檢測與識別方法有效
| 申請號: | 201610029195.1 | 申請日: | 2016-01-15 |
| 公開(公告)號: | CN105718866B | 公開(公告)日: | 2019-02-01 |
| 發明(設計)人: | 彭宇新;唐攀攀 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視覺 目標 檢測 識別 方法 | ||
本發明提供了一種視覺目標檢測與識別方法,包括以下步驟:對訓練樣本提取基本視覺特征訓練級聯分類器,得到目標的初步檢測模型;對訓練樣本提取強視覺特征訓練強分類器,得到目標的二次判別驗證模型;利用滑動窗策略對圖像進行掃描,得到候選圖像區域;利用二次判別驗證模型對目標候選區域進行二次判別驗證,得到最終的檢測與識別結果。本發明在初步檢測過程中采用多種基本視覺特征,增強了對復雜應用場景的魯棒性,并利用級聯分類器快速過濾掉大部分非目標區域,大大提高檢測速度,然后利用描述能力更強的局部特征和分類性能更好的強分類器對候選區域進行二次判別驗證,進一步去除較難分辨的非目標區域,有效提高了檢測與識別的準確性。
技術領域
本發明屬于視覺目標檢測與識別領域,具體涉及一種視覺目標檢測與識別方法。
背景技術
目標檢測是把感興趣的目標(如標志、車輛、行人等)從圖像或者視頻幀的背景中檢測出來并精確定位的過程,通常是利用目標的特征和位置區域來實現目標檢測。由于圖像背景復雜、目標與背景相互交錯、各種仿射變換以及光照不均等條件的限制,到目前為止要取得理想的目標檢測結果仍是一個難題。
近年來,經過研究人員的不斷努力,在某些約束環境下已經提出了一些有效的目標檢測方法。傳統的目標檢測方法包括背景差法、幀差法、光流法和基于模板的檢測方法等。然而,由于目標形狀和外貌千差萬別,使得運用常規的基于圖像處理的目標檢測方法往往不能達到較好的檢測效果。為此,研究人員提出了基于統計學習的目標檢測方法,如Viola等人在文獻“Robust Real-Time Object Detection”中提出了一種快速的人臉檢測算法,采用Haar特征描述待檢測區域的信息,并結合級聯分類器和滑動窗定位對待檢測區域是否包含目標進行判別,得益于積分圖像和級聯分類器的加速作用,該算法可以實現人臉目標的實時檢測,且具有較高的檢測率。Dalal等人在文獻“Histograms of OrientedGradients for Human Detection”中提出了利用HOG特征和SVM分類器的行人檢測算法,該方法分為訓練和預測兩個階段:在訓練階段,對訓練樣本提取HOG特征,并利用SVM分類器訓練得到一個行人分類器;在預測階段,利用滑動窗口對圖像進行掃描,利用訓練得到的分類器對候選窗口進行判別,最后在尺度空間融合檢測結果,得到最終的行人區域。另外,Felzenszwalb等人在文獻“A Discriminatively Trained,Multiscale,Deformable PartModel”中提出了利用可變形部件模型進行目標檢測的方法,首先通過HOG特征模板來刻畫目標整體及其每一個可變形部件,然后對這些部件進行匹配,在較大分辨率尺度下使用根濾波器匹配整個目標,在較細分辨率尺度下使用部件濾波器匹配目標的局部組成區域,最后將不同分辨率尺度下的匹配結果相結合,在目標檢測過程中,每個檢測窗口的得分等于所有部件的匹配得分減去模型變化的代價。該方法在訓練模型時需要訓練得到每一個可變形部件的HOG模型,以及衡量部件位置分布的代價參數。這些基于統計學習的目標檢測方法在一些公開的數據集上取得了很好的結果,然而,在實際應用中,使用單一方法往往并不能得到比較理想的檢測結果,主要原因在于一方面,實際應用中所要處理的圖像或者視頻幀往往比數據集要復雜,單一視覺特征或模型無法很好適用于這些復雜情況,為了提高檢測的準確性,往往需要同時使用多種視覺特征和目標模型;另一方面,這些方法的計算復雜度一般都比較高,如果不加改動直接使用的話時間代價太大,所以通常會根據實際應用場景結合多種方法,取長補短,在檢測效果和檢測速度上取得平衡。
綜上所述,現有的目標檢測技術的不足之處主要在于:常規的基于圖像處理的目標檢測方法無法適用于形狀復雜和外貌差別很大的目標;而基于統計學習的目標檢測方法由于魯棒性和復雜度的原因,需要根據實際應用場景做出相應調整和優化。
發明內容
針對現有技術的不足,本發明提出了一種視覺目標檢測與識別方法,該技術首先結合多種視覺特征和級聯分類器從圖像中獲取目標的候選區域,快速過濾掉大部分非目標的圖像區域,然后利用強視覺特征和強分類器對候選區域進行二次判別驗證,進一步去除較難分辨的非目標區域,獲得最終更準確的檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610029195.1/2.html,轉載請聲明來源鉆瓜專利網。





