[發明專利]基于CGCI-SIFT局部特征的圖像檢索方法有效
| 申請號: | 201210505313.3 | 申請日: | 2012-11-30 |
| 公開(公告)號: | CN102945289A | 公開(公告)日: | 2013-02-27 |
| 發明(設計)人: | 崔志明;吳健;蘇棟梁;趙朋朋 | 申請(專利權)人: | 蘇州搜客信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 蘇州創元專利商標事務所有限公司 32103 | 代理人: | 陶海鋒 |
| 地址: | 215021 江蘇省蘇州市蘇州工業*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cgci sift 局部 特征 圖像 檢索 方法 | ||
1.一種基于CGCI-SIFT局部特征的圖像檢索方法,提供用于檢索的圖像庫和待檢索的圖片,其特征在于,將圖片轉換成灰度圖,先對用于檢索的圖像庫進行局部特征描述處理,再進行圖像檢索,包括下列步驟:
(1)對于圖像庫中的每一張圖片采用DOG算法檢測特征點;
(2)對于每一個留下來的特征點,首先將該點的外周區域的像素點進行零均值規范化,所述外周區域為以特征點為中心,邊長為2R+1的方形區域,零均值規范化的公式如下所示:
式中I(x,y)與I'(x,y)分別表示原圖形像素強度以及規范化后的像素強度,(x,y)為進行零均值規范化的像素點在圖片中的位置,R為1?2~20的整數,NumC表示像素點周邊涉及計算的像素個數,NumC=R2;
(3)確定特征點的主方向,方法是:在以特征點為中心的圓形鄰域窗口中計算每個像素的梯度方向和梯度模值,
θ(x,y)=arctan{[I(x,y+1)-I(x,y-1)]/[I(x+1,y)-I(x-1,y)]}????(4)
其中,m(x,y)是像素點(x,y)的梯度模值,θ(x,y)是像素點(x,y)的梯度方向,梯度直方圖的范圍是0~3?60°,每1?0°代表一個方向,總共3?6個方向,直方圖的峰值即代表該特征點的主方向,所述圓形鄰域窗口的半徑為8;
(4)以特征點為中心,特征點的主方向為0°方向,建立極坐標系,以特征點為中心,R為半徑的區域為興趣區域,在此極坐標系中,將興趣區域劃分為內圍區域和外圍區域,內圍區域的半徑為4,周向均分為τ塊,τ取1或4,外圍區域分為2層,每層周向均分為δ+1塊,δ取3、7或15;從內圍區域中的塊開始計數,分別定義每個塊為Ri,內圍區域為R0至Rτ-1,外圍區域為Rτ至Rτ+2δ+1;
(5)對特征點外圍區域的每個塊,分別計算其正向強度對比值和負向強度對比值,如下:
正向強度對比值
負向強度對比值
式中pk為特征點,Ri表示外圍區域中的第i個塊,定義同步驟(4),p表示外圍區域的該塊中的像素點,NumRi+,NumRi-分別代表塊Ri中像素強度大于和小于特征點pk的像素點的個數,D(p)=I(p)-I(pk),I(p)是點p的像素強度,I(pk)是點pk的像素強度;
(6)對特征點的內圍區域的每個像素點,采用公式(3)(4)獲得梯度模值和梯度方向,然后統計內圍區域中Ri塊內的梯度值,并繪制梯度直方圖,梯度直方圖分為8個單元,每45°為一個單元,每個塊產生8個方向的梯度直方圖值,每個塊的方向梯度直方圖值表示為GRidj(i∈{0,…,τ-1}且j∈{0,…,7}),式中,GRidj表示塊中屬于同一45°方向單元的像素的模值的和,i表示所在的塊,j表示方向單元;
(7)分別對步驟(5)和(6)獲得的外圍區域和內圍區域的描述子進行整體歸一化,使得整體描述子對光照變化具有不變性,公式如下:
式子中GRidj'以及HRiP',HRiN'分別表示歸一化后的方向梯度直方圖值以及強度對比值;
(8)將兩個部分的歸一化后的描述子組合成一維向量,表示為:
描述子維度Dimen為:Dimen=8×τ+2×2×δ????(11)
重復(2)到(8),至所有特征點都處理完;
(9)采用K-Means聚類方法將圖像庫中的圖片進行特征點聚類,聚類結果生成K個子節點,計算出每個子節點的中心向量Ci,對新生成的每個子節點再進行K-Means聚類,以生成下一層的子節點,不斷重復直到樹的深度達到預設值P,構造出CGCI-SIFT詞匯樹,其中,K為5~10的整數,P為3~6的整數;
(10)將圖像庫中的圖片與詞匯樹進行關聯:詞匯樹的葉節點個數為M=kP-1,每個葉節點具有中心向量Cm,其中,m為1~M的整數,將每個葉節點稱為一個視覺詞匯單詞Wm,圖像庫中的總圖片數為N,其中每個圖片稱為一個文檔Fi,i是1~N的整數,則文檔Fi和視覺詞匯單詞Wm的相關度為Weight(i,m)=NUMim×idfm,式中,NUMim表示視覺詞匯單詞Wm在圖片文檔Fi中出現的次數,Nm表示視覺詞匯單詞Wm一共包含的圖片文檔數目;計算每個圖片與詞匯樹的每個葉節度的相關度,完成圖片與詞匯樹的關聯;
(11)進行圖片檢索,將待查詢圖片的CGCI-SIFT特征量化到CGCI-SIFT詞匯樹的M個視覺詞匯單詞上,形成一個M維的特征向量V={v1,v2......vM},具體方法為:
首先提取待查詢圖片的CGCI-SIFT特征點向量,對提取到的CGCI-SIFT特征點向量與步驟(9)中獲得的詞匯樹的節點逐層進行歐氏距離計算,找到一層上最相近的節點作為匹配節點,再從這些匹配節點的子節點分別向下搜索,直至找到葉節點中的各匹配節點,得到特征向量V={v1,v2......vM};
(12)利用在視覺詞匯層上量化后的特征向量V={v1,v2......vM},對圖像庫中所有圖片在視覺詞匯層上量化結果進行歐氏距離計算,和圖像庫量化后的每張圖片V'={v1',v2'......vM'}得到一個匹配值Wt1;
將結果按Wt1由小到大排序后輸出,完成圖像檢索。
2.根據權利要求1所述的基于CGCI-SIFT局部特征的圖像檢索方法,其特征在于:所述步驟(9)中,詞匯樹的構建方法是:設定聚類個數K,樹的深度P,對步驟(1)獲得的特征集合進行分層聚類,第一層獲得K個聚類,作為詞匯樹的K個子節點,計算出每個子節點的中心向量;對每個子節點分別進行聚類,每一子節點生成K個下一層的子節點,并計算出每個子節點的中心向量;不斷重復直到樹的深度達到預設值P,獲得SIFT詞匯樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州搜客信息技術有限公司,未經蘇州搜客信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210505313.3/1.html,轉載請聲明來源鉆瓜專利網。





