[發明專利]相似圖像的識別方法和裝置有效
| 申請號: | 201110031701.8 | 申請日: | 2011-01-28 |
| 公開(公告)號: | CN102622366A | 公開(公告)日: | 2012-08-01 |
| 發明(設計)人: | 薛暉 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 吳貴明 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似 圖像 識別 方法 裝置 | ||
技術領域
本申請涉及多媒體圖像識別技術領域,具體而言,涉及一種相似圖像的識別方法和裝置。
背景技術
相似圖像檢索是近幾年興起的技術,屬于多媒體識別的一種,其主要包含特征提取、索引構建、查詢、相似度排序等主要步驟。如圖1所示,在建立圖像索引庫時,用戶A向圖像服務器10上傳待存儲的圖像,圖像服務器10為該圖像生成圖像簽名,并以該圖像簽名作為索引,以便于后續的檢索查詢。當需要識別相似圖像時,用戶B向圖像服務器10請求相似圖像檢索,圖像服務器10根據該圖像的索引查詢與該圖像索引對應的相似圖像。在圖像服務器10查找到與用戶B輸入的圖像相似的圖像之后,向用戶B返回相似的圖像列表。
目前在生成圖像的圖像簽名時,常用的方法是在圖像服務器10中對圖片內容的二進制流進行哈希編碼,作為唯一標識該圖像的圖像簽名,然后將該圖像簽名常駐內存或存儲在圖像服務器10中的數據庫或文件系統中。
然而,上述現有技術的相似圖像檢索存在以下缺點:
1)通用性較差
對于同一副圖片,即使不做任何修改,以不同的格式(bmp、jpeg、png、gif等等)保存,得到的圖像簽名值也有很大的差異;然而大部分情況下,從用戶期望的角度來看,希望將兩幅僅僅格式不同的圖片作為相似圖片。
2)容錯性問題
由于沖突的原因,圖像的二進制流的哈希編碼不可能是唯一的,即存在這種情況,即便是兩張完全不同的圖片,也有可能會因為圖像簽名相同而被做為相同的圖片提供給圖像查詢者。
3)不適合用作近似檢索
傳統的基于哈希編碼的圖片簽名方式,由于沒有利用圖片本身的信息,因此只能用于精確檢索,即查找和目標圖片完全一樣的圖片,不適用作相似圖片檢索。
針對相關技術中所存在的問題,目前尚未發現有效的解決方案。
發明內容
本申請旨在提供一種相似圖像的識別方法和裝置,以解決現有技術中的圖像識別方法所存在的容錯性的問題。
根據本申請的一個方面,提供了一種相似圖像的識別方法,其包括:獲取與輸入圖像的內容信息對應的圖像簽名;對該圖像簽名進行哈希操作;在預先存儲的哈希表中查詢與該哈希操作的結果相對應的表項;在與查詢得到的該表項對應的候選圖像中識別與該輸入圖像相似的圖像。
進一步地,通過以下步驟獲取與輸入圖像的內容信息對應的圖像簽名:將輸入圖像轉化為灰度圖像;將灰度圖像分成N×N的子圖像,并對每個子圖像分別從M個方向上計算邊緣直方圖,得到N×N×M個計算結果,其中,N和M均為自然數;將灰度圖像對應的N×N×M個計算結果組合成作為圖像簽名的N×N×M維向量。
進一步地,對圖像簽名進行哈希操作的步驟包括:分別使用L個局部哈希函數對與該圖像簽名進行哈希操作,得到L個第一哈希值,其中,L為自然數;使用一個全局哈希函數分別對L個第一哈希值進行哈希操作,得到L個第二哈希值。
進一步地,在預先存儲的哈希表中查詢與哈希操作的結果相對應的表項的步驟包括:在每個第二哈希值對應的哈希表中查找是否存在記錄有該第二哈希值的表項,其中,所述哈希表中的每個表項記錄了一個圖像的哈希值和圖像標識,或者,所述每個表項記錄了一個圖像的哈希值、該圖像的圖像標識以及圖像簽名。
進一步地,第二哈希值與哈希表的對應關系包括:第i個第二哈希值對應于第i個哈希表,i=1,...L。
進一步地,分別使用L個局部哈希函數對圖像簽名進行哈希操作的步驟包括:將圖像簽名轉換成R維二進制向量,其中,R為自然數;使用R維二進制向量生成L個局部哈希函數,其中,每個局部哈希函數由R維二進制向量中的一維或多維二進制向量生成;使用L個局部哈希函數對R維二進制向量進哈希操作。
進一步地,使用R維二進制向量中的一維或多維二進制向量生成一個局部哈希函數的步驟包括:設置局部哈希函數的輸入參數為K;隨機從R維二進制向量中選取K維二進制向量,將K維二進制向量進行拼接作為局部哈希函數的返回值,其中,K<R。
進一步地,在與查詢得到的表項對應的候選圖像中識別與輸入圖像相似的圖像的步驟包括:計算輸入圖像的圖像簽名與每個候選圖像的圖像簽名之間的空間距離;按照空間距離的大小來識別候選圖像與輸入圖像的相似度,其中,空間距離越小的候選圖像與輸入圖像的相似度越高。
進一步地,按照空間距離的大小來識別候選圖像與輸入圖像的相似度之后,還包括:按照空間距離的大小輸出候選圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110031701.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可防止撥輪脫落的拇指輪裝置
- 下一篇:核污染探測無線傳感器節點布灑方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





