[發明專利]基于結構語義直方圖的圖像檢索方法有效
| 申請號: | 201310284272.4 | 申請日: | 2013-07-08 |
| 公開(公告)號: | CN103336830B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 劉廣海 | 申請(專利權)人: | 劉廣海 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 桂林市持衡專利商標事務所有限公司45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣西壯族自治區*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 結構 語義 直方圖 圖像 檢索 方法 | ||
1.基于結構語義直方圖的圖像檢索方法,其特征是包括如下步驟:
(1)將彩色圖像從RGB顏色空間轉換到HSV顏色空間;在HSV顏色空間中,H分量表示色彩信息,可用于表示不同顏色,稱之為顏色分量;
(2)在HSV彩色空間中,將H,S和V三個分量用于構建高斯金字塔H(σ),S(σ)和V(σ),其中σ∈[0...5]表示尺度,然后通過跨尺度抽樣并產生所謂的特征映射:
F(c,s,H)=|H(c)口H(s)|???????????(1)
F(c,s,S)=|S(c)口S(s)|??????????(2)
F(c,s,V)=|V(c)口V(s)|??????????(3)
式中,F(c,s,H)表示H分量的特征映射,F(c,s,S)表示S分量的特征映射,F(c,s,V)表示V分量的特征映射,H(c)表示H分量細尺度c的高斯金字塔,H(s)表示H分量粗尺度s的高斯金字塔,S(c)表示S分量細尺度c的高斯金字塔,S(s)表示S分量粗尺度s的高斯金字塔,V(c)表示V分量細尺度c的高斯金字塔,V(s)表示V分量粗尺度s的高斯金字塔,口表示中心-周邊差操作,它是在“中心”細尺度c和“周邊”粗尺度之間進行,并產生特征映射圖;
將每個特征映射圖縮小到尺度5,然后進行逐點相加,最后得到3個獨立顯著性圖像映射和
上述三式中,表示H分量的顯著性圖像映射,表示S分量的顯著性圖像映射,表示V分量的顯著性圖像映射,c表示細尺度,s表示粗尺度,表示映射圖的跨尺度相加,N(.)表示標準化;
將三個3個獨立顯著性圖像映射和V整合為一個顯著圖Shsv;
式中,Shsv表示顯著圖,N(.)表示標準化;
(3)在顯著圖Shsv以及顏色分量H中,采用SIFT算法來抽取和描述局部特征,得到顯著圖Shsv的特征向量和顏色分量H的特征向量
首先對顯著圖Shsv采用標準的K均值聚類來構建詞典,詞典大小設定為n’,則詞典里面有n’個視覺詞匯;詞典構建就是將顯著圖Shsv中所有的局部特征聚成n’個聚類中心,然后將一個聚類中心當作是一個視覺詞匯,則詞典里的n’個視覺詞匯可以表示為詞典里面的n’個視覺詞匯分別對應一個索引值IS=[0,1,2,...,n'-2,n'-1];
詞典構建完畢后,需要進行詞典量化并且進行索引值分配;詞典量化就是把從顯著圖Shsv中提取的每一個局部特征映射到它最接近的視覺詞匯上去,索引值分配就是給每一個局部特征所在的坐標點賦予一個對應的視覺詞匯索引值v,最后經過詞典量化的顯著圖Shsv表示為MS(x,y)=v,;
采用相同辦法對顏色分量H進行處理,則經過詞典量化后的顏色分量H表示為MC(x,y)=w,;
(4)將HSV顏色空間圖像從柱狀坐標系變換為笛卡爾坐標系,假設(H,S,V)為柱狀坐標系上的一個點,(H',S',V')為(H,S,V)在笛卡爾坐標系上的轉換,其中H'=S·cos(H),S'=S·sin(H)和V'=V;假設在HSV顏色空間圖像中有一個像素點(x,y),該像素點周邊有8個點,分別表示為(xi,yi),i=1,2,..,8,則標準刺激的強度I可以定義為:
在上述公式(8)中,周邊每個點和中心點都可以計出一個均勻顏色差別值Ii,i=1,2,...,8:
此時,代表刺激的最小可覺差△I=min(I1,I2,...,I8),即△I取I1~I8中的最小值;
判斷HSV顏色空間圖像中的各像素點是否滿足Weber原理,即△I/I=K,其中ΔI代表刺激的最小可覺差,I代表標準刺激的強度,K是設定的特定感覺道的定值,則保留該像素點(x,y)處的視覺詞匯,否則將像素點(x,y)處的視覺詞匯刪除;由此形成顯著圖Shsv的視覺詞匯圖像Ws(x,y)和顏色分量H的視覺詞匯圖像Wc(x,y);
(5)以視覺詞匯圖像Ws(x,y)和Wc(x,y)為基準,分別對它們進行視覺詞匯的局部結構檢測,可以得到基于顯著圖的局部結構模式和基于顏色的局部結構模式;視覺詞匯的局部結構檢測方法如下:
在Ws(x,y)中,將它劃分為一系列2×2的,相互不重疊方格;然后判斷2×2方格中是否為設定的局部結構模式中的一種,如果出現了其中一種局部結構模式,則該2×2方格中的視覺詞匯保持不變,否則將2×2方格內的視覺詞匯刪除,最終可得到一個結構圖像TS(x,y);采用相同辦法,由Wc(x,y)可以得到Wc(x,y)的結構圖像TC(x,y);
以某個結構詞匯為中心,在設定距離d范圍內,如果它的周邊存在若干個具有相同局部結構模式的結構詞匯,則這些結構詞匯的組合稱之為結構語義;
(6)分別統計結構圖像TS(x,y)和TC(x,y)中視覺詞匯出現的頻率,并將若干個結構詞匯之間的均勻顏色差別作為權重,最后綜合頻率和均勻顏色差別來描述圖像內容,其中
在結構圖像TS(x,y)和TC(x,y)中,視覺詞匯出現的頻率計算方法如下:
Hs(i)=card{(x,y)|Ts(x,y)=i}/(wid×hei)?????????(10)
HC(j)=card{(x,y)|TC(x,y)=j}/(wid×hei)???????(11)
上述兩式中,Hs(i)表示TS(x,y)中視覺詞匯出現的頻率,其中;HC(j)表示TC(x,y)中視覺詞匯出現的頻率,其中;card{.}表示統計詞匯個數,分別是統計TS(x,y)中的顯著圖詞匯和TC(x,y)中的顏色詞匯,wid和hei分別表示圖像寬和圖像高;
計算均勻顏色差別的方法如下:
假設在結構圖像TS(x,y)和TC(x,y)中有兩個結構詞匯,它們所在位置分別對應兩個坐標點(x,y)和(x',y'),在笛卡爾坐標系中,這兩個坐標點分別對應的HSV顏色值為(H'(x,y),S'(x,y),V'(x,y))和(H'(x',y'),S'(x',y'),V'(x',y')),則它們之間顏色差別△cd計算方法如下:
CDS(i)表示顯著圖詞匯的顏色差別直方圖,CDC(j)表示顏色詞匯的顏色差別直方圖,它們分別定義如下:
上述兩式中,△cds表示結構圖像TS(x,y)中,兩個坐標點(x,y)和(x',y')之間的顏色差別;△cdc表示結構圖像TC(x,y)中,兩個坐標點(x,y)和(x',y')之間的顏色差別;Ts(x,y)=Ts(x',y')表示在結構圖像TS(x,y)中兩個坐標點(x,y)和(x',y')所對應的視覺詞匯具有相同索引值i,;Tc(x,y)=Tc(x',y')表示在結構圖像TC(x,y)中兩個坐標點(x,y)和(x',y')所對應的視覺詞匯具有相同索引值j,;
顯著圖詞匯的結構語義直方圖SH(i)和顏色詞匯的結構語義直方圖CH(j),它們分別定義如下:
SH(i)=CDS(i)×Hs(i),i=0,1,...,n-1??????????(15)
CH(j)=CDC(j)×Hc(j),j=0,1,2,..,n-1???????(16)
SSH=concac{SH(i),CH(j)}???????????(17)
上述三式中,concac{.}表示將上述兩個直方圖串聯起來形成一個最終的直方圖,即是結構語義直方圖SSH;i和j用做直方圖的下標;在CDS(i)和HS(i)中,i=0,1,2,...,n-1表示顯著圖詞匯的索引值;在CDC(j)和CH(j)中,j=0,1,2,...,n-1表示顏色詞匯索引值;
(7)將結構語義直方圖中的特征向量作為最終特征應用于圖像檢索,并且采用L1距離來進行圖像匹配。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉廣海,未經劉廣海許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310284272.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種烘干卷布機
- 下一篇:過水平生產線用的牽引裝置





