[發明專利]一種整合特征字典結構與視覺特征編碼的圖像分類方法在審
| 申請號: | 201410693888.1 | 申請日: | 2014-11-26 |
| 公開(公告)號: | CN104331717A | 公開(公告)日: | 2015-02-04 |
| 發明(設計)人: | 楊育彬;朱啟海 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 胡建華 |
| 地址: | 210023 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 整合 特征 字典 結構 視覺 編碼 圖像 分類 方法 | ||
1.一種整合特征字典結構與視覺特征編碼的圖像分類方法,其特征在于,包括如下步驟:
步驟1,提取圖像的視覺特征:對每幅圖像進行局部采樣,得到一組區域塊,提取每塊區域的視覺特征,得到每幅圖像對應的視覺特征集合,稱所有圖像的視覺特征集合的整體為所有圖像的視覺特征集,記為集合X;
步驟2,特征字典學習:以集合X為輸入,使用特征字典學習方法,得到由一組具有代表性的視覺單詞組成的特征字典;
步驟3,視覺特征編碼:將每幅圖像的每個視覺特征表示成視覺單詞的線性組合,每個視覺單詞對應一個系數,稱這組系數為視覺特征的編碼;
步驟4,視覺特征編碼的空間匯合:以每幅圖像的所有視覺特征的編碼為輸入,使用統計方法,將每幅圖像表示為一個向量,該向量就是對應圖像的圖像特征表示;
步驟5,將步驟4得到的每幅圖像的編碼作為輸入,使用分類模型進行訓練和分類,得到分類結果。
2.根據權利要求1所述的方法,其特征在于,步驟1包括如下步驟:
對于圖像I進行局部采樣,每次采樣得到一個區域塊,每個區域塊提取一個視覺特征,得到圖像I的視覺特征集合LFSI,最終得到所有圖像的視覺特征集合X=[x1,x2,…,xN]∈Rd×N,其中,d表示視覺特征的維度,N表示所有圖像的視覺特征的總數,xi表示第i個視覺特征,i取值1~N。
3.根據權利要求2所述的方法,其特征在于,步驟2包括如下步驟:
以集合X為輸入,使用特征字典學習方法,得到由一組具有代表性的視覺單詞組成的特征字典,將該特征字典記為:B=[b1,b2,…,bM]∈Rd×M,其中M為視覺單詞的個數;bj是一個維度d的列向量,表示第j個視覺單詞,j取值1~M。
4.根據權利要求3所述的方法,其特征在于,步驟3包括如下步驟:
針對視覺特征xi,選取視覺特征xi的由步驟2得到的特征字典B中的p個最近鄰的視覺單詞,即與視覺特征xi的距離最小的p個視覺單詞,p取值1~M,記這p個視覺單詞組成的特征字典為Bi,i取值1~N,求出特征字典Bi中各視覺單詞之間的距離所表示的矩陣Di,矩陣Di的第m行s列的元素為特征字典Bi中對應視覺單詞之間的距離,m,s=1,2,…,p;再計算視覺特征xi到特征字典Bi的各視覺單詞的距離表示的列向量di,di的第n個分量din表示視覺特征xi與Bi中第n個視覺單詞之間的距離,n=1,2,…,p,以xi,di,Di,Bi和兩個參數λ與β為輸入,λ,β≥0,最小化下式,得到xi在Bi上的編碼
其中表示點積,即兩個向量對應的分量相乘得到一個新向量;求解得到xi在這p個視覺單詞的編碼結果最后對編碼中的分量排序,得到k個最大的編碼系數及其對應的k個視覺單詞構成的特征字典k=1,2,…,p,則視覺特征xi的編碼zi是一個M維的向量,向量中與對應的分量為其余分量都置為0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410693888.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:不形成毛刺的激光鉆孔
- 下一篇:多脈沖激光燒蝕金屬覆層定量去除方法





