[發明專利]一種網絡環境下的近似重復圖像搜索方法有效
| 申請號: | 201410602359.6 | 申請日: | 2014-10-31 |
| 公開(公告)號: | CN104462199B | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 胡衛明;李峻;興軍亮 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京瀚仁知識產權代理事務所(普通合伙)11482 | 代理人: | 宋寶庫 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 環境 近似 重復 圖像 搜索 方法 | ||
技術領域
本發明涉及網絡多媒體信息處理領域,特別涉及一種網絡圖像搜索技術。
背景
隨著互聯網的普及和信息處理技術的不斷發展,網絡多媒體信息處理成為日益關注的焦點。多媒體包括文本,圖形,聲音,圖像動畫等各種信息院。由于當前圖像處理的技術日新月異,網絡圖像數據量也呈現爆炸式的增長,然而這里面包含了很多經過編輯、修飾、拼接之后的重復圖像。這就帶來了圖像盜版和侵權的問題。近年來對于近似重復圖像搜索問題,眾多學者展開了廣泛的研究。不失一般性,近似重復圖像搜索指的是找到所有的給定圖像的變換拷貝圖像,本發明關注的是“圖像”類的近似重復圖像搜索,即所有的拷貝圖像和原始圖像共有同源圖像。
為了有效解決近似重復圖像搜索的問題,視覺詞包模型成為一種被廣泛應用的解決方案,它提供了一種局部圖像描述的有效統計信息,并同時生成一種緊致的基于直方圖統計的圖像表示。詞包模型最早應用于目標檢測和圖像分類領域。由于傳統的詞包模型沒有考慮特征的空間分部信息,而近似重復圖像存在局部差異性和整體相似性的特點,所以在進行特征量化的階段,需要將特征的空間分布統計和特征量化相結合,對圖像進行基于空間感知的區域量化。
圖1為網絡近似重復圖像的示例圖,從圖中可以看出,網絡環境下的近似重復圖像包括了更多更顯著的圖像變換,如:文字嵌入、圖像剪裁拼接等等,這些變換明顯改善了圖像表觀,都為網絡近似重復圖像搜索帶來了極大的挑戰。
發明內容
本發明的目的在于提出一種對圖像進行基于空間感知的量化方法,以解決網絡環境下近似重復圖像搜索的問題。
為實現上述目的,本發明提出一種基于空間感知的網絡近似重復圖像搜索方法,其方法包括離線階段和在線階段,步驟如下:
離線階段:
步驟A1:提取和描述輸入網絡圖像的低層局部特征;
步驟A2:利用上述局部特征構建視覺詞典,并將上述局部特征量化后,生成圖相的全局特征描述;
步驟A3:構建倒排序索引;
在線階段:
步驟B1:提取和描述給定查詢圖像的低層局部特征;
步驟B2:將B1種所獲得的局部特征量化;
步驟B3:計算查詢圖像與離線階段所輸入網絡圖像的相關性,并對帶匹配圖像進行排序。
優選的,步驟B1與步驟A1中的所述的局部特征提取方法相同,步驟B2與步驟A2中所述的局部特征量化方法相同。
優選的,所述步驟A1包括:
步驟A11:對于輸入的網絡圖像進行局部關鍵點的提取,并去除離群噪聲點;
步驟A12:對所有保留的關鍵點,在其周圍領域統計相關梯度方向信息,并生成基于梯度方向直方圖的特征描述子。
優選的,所述步驟A2包括:
步驟A21:選取圖像訓練集,并提取圖像訓練集中所有圖像的局部特征,通過無監督K-均值聚類法,對訓練特征集進行聚類進而生成視覺詞典;
步驟A22:在線更新視覺詞典,使得詞典適應于輸入的網絡圖像并保持一致性;
步驟A23:在得到更新后的詞典之后,利用局部約束線性編碼的方法,將輸入的網絡圖像中的所有特征進行量化,并映射到視覺詞典上;
步驟A24:利用圖像金字塔對圖像進行弱分割,將量化后的局部特征按照分塊原則進行特征的聚集,并生成圖像的分塊表示。
步驟A25:將不同層次上的所有圖像分塊表示串聯起來,生成一幅圖像的整體表示。
優選的,所述步驟A3包括:
離線階段對于輸入網絡圖像中的所有圖像表示按照視覺單詞目錄建立倒排索引,并計算詞頻和倒排文檔頻率。
優選的,所述步驟B3包括:
步驟B31:通過計算詞頻以及倒排文檔頻率加權求和的方法計算給定查詢圖像與輸入網絡圖像之間的相關性;
步驟B32:按照圖像的相關性對待匹配圖像進行排序,返回圖像序列中排在前面的圖像,作為給定查詢圖像的近似重復圖像。
優選的,步驟A24所述圖像金字塔為兩層圖像金字塔,第一層為圖像本身,第二層被分為2*2圖像單元。
本發明所提出的基于空間感知的網絡近似重復圖像搜索方法,可以將特征的空間分布統計信息嵌入圖像特征表示,能夠充分利用近似重復圖像的局部差異性和全局相似性的特點,所以本發明在近似重復圖像搜索準確度方面比傳統的視覺詞包模型的準確度更高。
附圖說明
圖1為網絡近似重復圖像示例圖。
圖2為本發明所采用的空間金字塔分割圖像示意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410602359.6/2.html,轉載請聲明來源鉆瓜專利網。





