[發(fā)明專利]搜索圖像的方法和裝置有效
| 申請?zhí)枺?/td> | 201210183184.0 | 申請日: | 2012-06-06 |
| 公開(公告)號: | CN102779157A | 公開(公告)日: | 2012-11-14 |
| 發(fā)明(設(shè)計)人: | 甘永洲;井振剛;鄧正平 | 申請(專利權(quán))人: | 北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/64 |
| 代理公司: | 中原信達知識產(chǎn)權(quán)代理有限責(zé)任公司 11219 | 代理人: | 李寶泉;周亞榮 |
| 地址: | 100176 北京市北京經(jīng)濟*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 搜索 圖像 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機圖像處理技術(shù),特別地涉及一種搜索圖像的方法和裝置。
背景技術(shù)
當(dāng)今社會,隨著電子計算機和互聯(lián)網(wǎng)的飛速發(fā)展,計算機視覺逐漸被人們所重視,其應(yīng)用在人們生活的各個領(lǐng)域,涉及電子商務(wù),安防監(jiān)控,工業(yè)檢測,人工智能等諸多方面,而其展現(xiàn)的驚人能力也為人贊嘆。其中,計算機數(shù)字圖像處理是其極為重要和基礎(chǔ)的一個方面,通過對圖像進行計算機分析,能夠解決諸多憑借人眼,人腦不能解決或不能迅速解決的問題。
圖像搜索通常是指在圖庫中選擇與被比圖像具有較高相似性的圖庫圖像。該相似性越高,說明搜索圖像的準(zhǔn)確性越高。當(dāng)計算機圖像處理出現(xiàn)以前,傳統(tǒng)的圖像搜索還停留在由人眼進行比對,在圖庫圖像數(shù)量巨大的情況下,人工的方式難以查到在圖庫中與被比圖像最為接近的一幅或多幅圖像。隨著計算機視覺及計算機圖像處理的出現(xiàn),方法由傳統(tǒng)的人工方式改變?yōu)橛嬎銠C搜索圖像,其中通過計算機對圖像進行分析,得到圖像的各種特征,同時與圖像庫中的圖像進行比對,最終搜索到一樣或者相似的目標(biāo)圖像信息。但是由于受圖像拍攝環(huán)境復(fù)雜度以及圖像庫的豐富程度的影響,目前計算機搜索圖像的準(zhǔn)確性也比較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供一種搜索圖像的方法和裝置,能夠提高從圖庫中搜索與被比圖像相似的圖庫圖像的準(zhǔn)確性。
為實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種搜索圖像的方法。
本發(fā)明的搜索圖像的方法包括:針對具有預(yù)設(shè)的統(tǒng)一尺寸并且灰度化之后的圖庫圖像,進行HOG特征分布計算并統(tǒng)計得到該圖庫圖像的梯度直方圖特征向量,并且進行SIFT密度特征分布計算得到多個特征點,以及將該圖庫圖像分成多個子圖像,對于包含的所述特征點的密度大于密度預(yù)設(shè)值的子圖像,對該子圖像內(nèi)的特征點進行SIFT角度特征計算并按預(yù)設(shè)的角度步長統(tǒng)計得到該圖庫圖像的角度直方圖特征向量;針對具有所述預(yù)設(shè)的統(tǒng)一尺寸并且灰度化之后的被比圖像,同樣進行上述計算以得到該被比圖像的梯度直方圖特征向量和角度直方圖特征向量;根據(jù)所述被比圖像的梯度直方圖特征向量和角度直方圖特征向量分別與所述圖庫圖像的梯度直方圖特征向量和角度直方圖特征向量之間在賦范線性空間的距離確定所述被比圖像與所述圖庫圖像的相似度,根據(jù)該相似度從所述圖庫中選擇與所述被比圖像具有相似性的圖庫圖像。
可選地,進行HOG特征分布計算并統(tǒng)計得到該圖庫圖像的梯度直方圖特征向量包括:將圖庫圖像分成A行B列圖塊,A、B表示自然數(shù),其中各行的各個圖塊與相鄰圖塊有重疊;計算每個圖塊內(nèi)每個像素的梯度;按預(yù)設(shè)的梯度方向角度步長統(tǒng)計每個圖塊內(nèi)的像素的梯度得到該圖塊的梯度直方圖特征向量;將所述圖庫圖像中的每個圖塊的梯度直方圖特征向量級聯(lián)得到該圖庫圖像的梯度直方圖特征向量。
可選地,進行HOG特征分布計算并統(tǒng)計得到該圖庫圖像的梯度直方圖特征向量包括:將圖庫圖像分成A行B列圖塊,A、B表示自然數(shù),其中各行的各個圖塊與相鄰圖塊有重疊;將每個圖塊分成C行D列子圖塊,C、D表示自然數(shù);計算每個子圖塊內(nèi)每個像素的梯度;按預(yù)設(shè)的梯度方向角度步長統(tǒng)計每個子圖塊內(nèi)的像素的梯度得到該子圖塊的梯度直方圖特征向量;針對各個所述圖塊,將該圖塊的每個子圖塊的梯度直方圖特征向量級聯(lián)得到該圖塊的梯度直方圖特征向量;將所述圖庫圖像中的每個圖塊的梯度直方圖特征向量級聯(lián)得到該圖庫圖像的梯度直方圖特征向量。
可選地,C=D=2。
可選地,所述預(yù)設(shè)的梯度方向角度步長為40°。
可選地,A=B=3。
可選地,所述將該圖庫圖像分成多個子圖像包括將該圖庫圖像分成E行F列子圖像;所述子圖像包含的所述特征點的密度,是該子圖像包含的特征點的個數(shù)與該子圖像所在圖庫圖像包含的特征點的個數(shù)的比值;所述密度預(yù)設(shè)值為1/(E×F)。
可選地,所述預(yù)設(shè)的角度步長為20°。
可選地,所述賦范線性空間為歐氏空間。
可選地,在對所述圖庫圖像進行灰度化之前,所述方法還包括對所述圖庫圖像進行等比縮放的步驟,其中,判斷若所述圖庫圖像的寬度和高度都大于預(yù)設(shè)長度,則將二者縮小并保持圖像的寬高比不變,而且二者中的較小者縮小至預(yù)設(shè)長度。
可選地,所述預(yù)設(shè)長度屬于區(qū)間[500,800],單位為像素。
可選地,在進行所述HOG特征分布計算以及所述SIFT密度特征分布計算之前,所述方法還包括:對經(jīng)過所述等比縮放的步驟之后的圖庫圖像進行雙邊濾波處理。
根據(jù)本發(fā)明的另一方面,提供了一種搜索圖像的裝置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210183184.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





