[發明專利]圖像特征提取、訓練、檢測方法及模塊、裝置、系統有效
| 申請號: | 201310218938.6 | 申請日: | 2013-06-04 |
| 公開(公告)號: | CN103345631A | 公開(公告)日: | 2013-10-09 |
| 發明(設計)人: | 魏代猛;趙勇;黎國梁;程如中;李晶晶 | 申請(專利權)人: | 北京大學深圳研究生院 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/66 |
| 代理公司: | 深圳鼎合誠知識產權代理有限公司 44281 | 代理人: | 郭燕;彭家恩 |
| 地址: | 518055 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 特征 提取 訓練 檢測 方法 模塊 裝置 系統 | ||
技術領域
本申請涉及圖像處理領域,尤其涉及一種圖像特征提取、訓練、檢測方法及模塊、裝置、系統。
背景技術
物體檢測是計算機視覺的核心問題之一。基于統計學的物體檢測方法主要是通過機器學習,從一系列訓練數據中訓練得到一個分類器,然后利用分類器對輸入窗口進行識別。物體檢測方法關鍵的有兩點,其一是特征提取,其二是分類器設計。特征提取的目的是降低數據的維數,得到能反映物體屬性的特征,從而方便分類。好的特征應當具有區分能力強、計算簡單、魯棒性強和形式簡單等特點。分類器設計屬于機器學習范疇,其目的是得到一個計算復雜度較低且推廣性較好的分類器。
梯度直方圖(Histogram?of?Oriented?Gradients,HOG)特征是一種用來進行物體檢測的特征描述子,它通過計算和統計圖像局部區域的HOG來構成特征。HOG特征結合分類器已經被廣泛應用于圖像識別中,尤其在行人檢測中獲得了極大的成功。現有的HOG特征提取方法大致如下述:首先,將灰度圖像進行歸一化,以調節圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時抑制噪音干擾;然后,計算圖像中每個像素的梯度(包括梯度大小和梯度方向)形成梯度圖像,以捕獲輪廓信息,進一步弱化光照的干擾;其次,對梯度圖像劃分細胞單元(cell),例如,cell大小可為6像素×6像素大小;再者,統計每個cell的HOG,形成每個cell的描述子;進一步地,將幾個cell組成塊(block),例如,每個block包含9個cell(兩個方向上均為3個cell),一個block內的所有cell的HOG級聯便得到該block的HOG描述子;最后,將整個圖像內所有block的HOG描述子級聯,即可得到整個圖像的HOG特征了。
但是,現有的HOG特征提取方法的檢測率仍然較低,限制了其在物體檢測中的推廣應用。
發明內容
本申請提供一種圖像特征提取、訓練、檢測方法及模塊、裝置、系統,以提高物體檢測的檢測率。
根據本申請的第一方面,本申請提供一種圖像特征提取方法,包括:
采用第一掃描窗以第一預設定步長對原始梯度圖像進行掃描,得到所述原始梯度圖像中各第一掃描區域對應的、用于表征所述第一掃描區域梯度大小及方向信息的N維度向量,其中,N取正整數;并進行如下處理,得到N個方向圖像:將第x個第一掃描區域對應的第n維度向量映射到第n個方向圖像的第x映射單位中,其中,n∈(1,2,……,N),x∈(1,2,……,X),X為第一掃描區域的數量;
對每個所述方向圖像進行如下處理:以預設定大小的單元格劃分所述方向圖像,每個所述單元格包含多個映射單位;采用第二掃描窗以第二預設定步長對所述劃分后的方向圖像進行掃描,得到所述方向圖像中各第二掃描區域對應的、用于表征所述第二掃描區域梯度大小信息的M維度向量,其中,M取正整數;組合每個所述方向圖像各所述第二掃描區域的M維度向量,得到方向圖像特征;
組合各所述方向圖像特征,得到所述原始梯度圖像對應的附加梯度方向直方圖特征。
根據本申請的第二方面,本申請提供一種訓練方法,包括:
采集物體圖像集及背景圖像集;
對所述物體圖像集及背景圖像集中各待處理圖像提取特征;
使用所述特征進行訓練,得到用于區分物體及背景的分類器,
對所述物體圖像集及背景圖像集中各待處理圖像提取特征具體包括:
獲得所述待處理圖像的原始梯度圖像;
由所述原始梯度圖像得到待處理圖像的主梯度方位直方圖特征,其中,采用第一掃描窗以第一預設定步長對所述原始梯度圖像進行掃描,得到所述原始梯度圖像中各第一掃描區域對應的、用于表征所述第一掃描區域梯度大小及方向信息的N維度向量,其中,N取正整數;
進行如下處理,得到N個方向圖像:將第x個第一掃描區域對應的第n維度向量映射到第n個方向圖像的第x映射單位中,其中,n∈(1,2,……,N),x∈(1,2,……,X),X為第一掃描區域的數量;對每個所述方向圖像進行如下處理:以預設定大小的單元格劃分所述方向圖像,每個所述單元格包含多個映射單位;采用第二掃描窗以第二預設定步長對所述劃分后的方向圖像進行掃描,得到所述方向圖像中各第二掃描區域對應的、用于表征所述第二掃描區域梯度大小信息的M維度向量,其中,M取正整數;組合每個所述方向圖像各所述第二掃描區域的M維度向量,得到方向圖像特征;組合各所述方向圖像特征,得到所述原始梯度圖像對應的附加梯度方向直方圖特征,以使用所述附加梯度方向直方圖特征及主梯度方位直方圖特征進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學深圳研究生院,未經北京大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310218938.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:風扇馬達
- 下一篇:泵送混凝土速效防坍恢復劑
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





