[發明專利]一種基于視覺詞匯本集體的不變性識別方法無效
| 申請號: | 201010132099.2 | 申請日: | 2010-03-25 |
| 公開(公告)號: | CN101807259A | 公開(公告)日: | 2010-08-18 |
| 發明(設計)人: | 危輝;羅會蘭 | 申請(專利權)人: | 復旦大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 上海正旦專利代理有限公司 31200 | 代理人: | 陸飛;盛志范 |
| 地址: | 20043*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視覺 詞匯 集體 不變性 識別 方法 | ||
1.一種基于視覺詞匯本集體的不變性識別方法,其特征在于利用數據和興趣點采樣 以及利用不同描述子表示圖像不同方面信息,生成視覺詞匯本集體,具體步驟如下:
1)首先對訓練數據集隨機采樣得到訓練數據子集;
2)對此訓練子集中的每個圖像提取興趣點,然后從中隨機采樣一部分;
3)對采樣得到的興趣點集分別采用不同的描述方法描述,使用聚類算法對不同的描 述方法描述的興趣點集進行聚類得到一個視覺詞匯本;
4)重復步驟1到步驟3,直到生成預設大小的視覺詞匯本集體;
所述不同的描述方法采用如下8種描述子:
(1)顏色描述子:興趣點中的每個像素的顏色值用來形成n×n×3維的特征矢量, 用這種類型的描述子來捕獲圖像的顏色信息;
(2)顏色小波描述子:對每個興趣點的顏色信息進行‘Haar’二維小波一階分解來得 到n×n×3維的特征矢量;
(3)邊信息描述子:‘Canny’邊檢測子用來獲得n×n維描述子;使用這種類型的描述 子,物體的形狀信息被用來識別物體;
(4)局部范圍描述子:輸出每個像素的3×3鄰域內的灰度值范圍,得到一個n×n維 描述子;
(5)局部標準差描述子:輸出每個像素的3×3鄰域內的灰度值標準差,得到一個n ×n維描述子;
(6)局部熵值描述子:輸出每個像素的9×9鄰域內的熵值,得到一個n×n維描述子;
(7)基于灰度值共生矩陣的二階統計描述子:考慮距離為1像素,方向分別為水平、 對角線、垂直和反對角線的像素對;計算共生矩陣的對比度值、角二階矩值、相關系數和 方差;這種描述子的維度是16;
(8)基于灰度值共生矩陣的二階統計描述子:考慮距離為2像素,方向分別為水平 和垂直的像素對;計算共生矩陣的對比度值、角二階矩值、相關系數和方差;這種描述子 的維度是8;
其中,n×n為圖像的興趣點尺寸,即像素數。
2.根據權利要求1所述的方法,其特征在于根據視覺詞匯本集體生成相應分類器集 體,具體步驟如下:
(1)對于生成的視覺詞匯本集體,每個成員視覺詞匯本融合了不同的圖像信息;
(2)對于一個成員視覺詞匯本,對訓練數據進行量化;
(3)在量化后的訓練數據集上學習一個分類器;
(4)重復步驟(2)到步驟(3),生成預設大小的分類器集體。
3.根據權利要求2所述的方法,其特征在于對新的圖像進行識別時,首先用學習到 的視覺詞匯本集體對圖像分別量化,然后分別用相應分類器集體中的成員進行識別;將分 類器集體識別結果集成得到最終識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于復旦大學,未經復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010132099.2/1.html,轉載請聲明來源鉆瓜專利網。





