[發明專利]一種基于多分辨率框架的物體識別檢測方法有效
| 申請號: | 201010134143.3 | 申請日: | 2010-03-29 |
| 公開(公告)號: | CN101807256A | 公開(公告)日: | 2010-08-18 |
| 發明(設計)人: | 張加萬;付磊;張怡;高中杰 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程毓英 |
| 地址: | 300072 天*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分辨率 框架 物體 識別 檢測 方法 | ||
技術領域
本發明屬于計算機視覺領域,涉及一種物體識別檢測方法。
背景技術
本發明中涉及到的背景技術有:
(1).快速魯棒性(Speeded?Up?Robust?Features,SURF)圖像局部特征描述符(見文獻 [1]):SURF具有尺度及旋轉不變,對于光照變化具有很好魯棒性的特征,而且相比于其他局 部特征,這種特征采取了不同的特征提取方式,增加了特征的提取速度,同時降低了描述的 維數,并且具有較好的特征特異性,達到很好的識別率,近幾年在計算機視覺的多個方面得 到了應用。
(2).在眾多物體識別檢測算法中,基于有監督學習的物體檢測算法能夠準確快速地檢測 出圖像中想要類別的物體,而并不把其他類別的物體檢測出來,即在檢測的同時識別物體, 而且這種物體檢測算法能夠對單張圖像進行物體檢測,對于復雜場景也能取得比較好的檢測 效果。例如,Agarwal(見文獻[2])等人提出使用Forstner感興趣點檢測子檢測圖像特正, 然后通過SnoW(Sparse?Network?of?Winnows)學習框架訓練分類器,利用該分類器形成多尺 度空間的分類活動圖,通過分析活動圖實現物體的檢測。Dalal(見文獻[3])等人提出利用 梯度方向柱狀圖,結合SVM分類器實現人臉的檢測,并達到很好的效果。但是這些算法依然 面臨很多的問題和挑戰,如尺度變化、旋轉變化、平移變化、光照變化、視角變化等問題。
發明內容
本發明的目的在于客服現有技術的上述不足,提供一種能夠在具有尺度變化、視角變化、 旋轉變化、亮度變化、部分遮擋等復雜條件下準確并快速的檢測到物體位置的物體識別檢測 方法。為此,本發明采用如下的技術方案:
一種基于多分辨率框架的物體識別檢測方法,包括構造多分辨率框架分類器和多分辨率 框架下物體檢測兩部分,步驟如下:
第一步:分別選擇所要分類物體的正負樣本圖像,正樣本為所要分類別的物體圖像,負 樣本為非該類物體的任意其他物體圖像,設原始圖像分辨率為R,構造用于分類器的訓練集 T(R),;
第二步:將訓練集T(R)分別作不同采樣率σ的采樣,得到圖像的分辨率分別為 r=1,2,3……R的各個分辨率下的圖像訓練集合T(r);
第三步:按照下列方法得到物體分類器C(r),最終得到一個包含各個分辨率的層次分 類器H(r),H(r)是由R個單獨的分類器C(r)構成:
(a)從圖像訓練集合T(r)中,分別提取正樣本和負樣本中所有圖像的SURF特征描述 符,正負樣本特征描述符分別存儲兩個集合之中;(b)利用K-means聚類方法,對正負樣本 集的特征描述符進行聚類分析;(c)將正負樣本集合的聚類結合,形成圖像特征詞典;(d) 根據正負樣本集合在聚類中的索引,求出每幅圖像聚類直方圖,并根據正負樣本對應相應的 標簽,將直方圖數據和標簽進行支持向量機訓練,得到分辨率r下的分類器C(r);
第四步:將待檢測的圖像根據多分辨率分類器的構造流程分別提取R個分辨率不同分辨 率的圖像,然后對不同分辨率的測試圖像再依次提取不同尺度s的多尺度圖像,s=1,2,3……S, 尺度因子為β;
第五步:在每個分辨率圖像的各個尺度空間使用相同大小的窗口進行檢測,在不同分辨 率之間窗口使用不同的窗口進行檢測,每個分辨率的窗口大小為(wr,hr)=(w,h)/aR-r,w,h分 別是原始分辨率窗口的長和寬,a是固定常數;
第六步:對于每個分辨率r和尺度s,所有初始檢測窗口的狀態全部初始化為1,使用分 類器C(r)以同樣窗口大小檢測分辨率r的各個尺度空間圖像,在尺度空間s上,將檢測為0, 即不包含物體的窗口區域丟棄,將檢測為1即包含物體的窗口區域保留,傳遞到r+1分辨率 同一尺度空間s中去,依次進行,直到檢測到最高分辨率R,得到最高分辨率R中不同尺度 空間s包含物體的區域;
第七步:在原始分辨率R下各個尺度空間通過使用Mean-shift聚類的方法來得到物體的 最終位置。
作為優選實施方式,其中第三步的步驟(b)包括下列步驟:利用K-means聚類方法,將 正負樣本集的特征描述符分別聚成K類,各自形成K個關鍵字,并且得到每幅圖像中特征描 述符的聚類索引,即每個特征符存在哪個聚類當中,同時記下每個聚類中心的中心數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010134143.3/2.html,轉載請聲明來源鉆瓜專利網。





