[發明專利]基于SIFT特征的海量圖像實時檢索方法有效
| 申請號: | 201310346542.X | 申請日: | 2013-08-12 |
| 公開(公告)號: | CN104375990B | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 程濤 | 申請(專利權)人: | 北京拓爾思信息技術股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100088 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 sift 特征 海量 圖像 實時 檢索 方法 | ||
技術領域
本發明涉及多媒體信息處理領域,具體地說,是涉及一種基于SIFT特征的海量圖像實時檢索方法。
背景技術
圖像檢索技術從基于文本的檢索發展到基于內容的檢索技術,取得了較大進展,尤其是SIFT特征的提出,可以說是21世紀以來計算機視覺領域特征研究的最重要成果。但是基于內容的圖像檢索技術,面對巨大的、實時擴展、時刻變化的圖像數據庫,受到存儲空間和計算復雜度的限制。海量圖像的實時檢索在當下存在較大的困難和挑戰。
目前在海量圖像檢索方面,主要通過兩種方式來提高檢索效率,第一種在搜索方法和索引方法上面做改進,對檢索算法、特征存儲數據結構、索引存儲結構及方式進行改進和優化;第二種采用時興的分布式處理模式,將特征抽取、存儲和索引等任務分配給一個超大集群處理。這些為海量圖像檢索效率帶來了一定程度的提升,但是依然需要龐大的硬件條件支撐,并未能從本質上優化海量圖像特征存儲空間,改進圖像實時檢索的計算復雜度。
為此,針對目前多媒體技術、傳感技術、互聯網技術的發展,對海量圖像檢索的時效性需求,本發明提出一種基于SIFT特征的海量圖像實時檢索方法,將SIFT特征進行壓縮存儲,并設計基于SIFT基因的高效特征匹配算法,以解決當前海量圖像檢索時特征存儲空間災難和計算復雜度高的問題。
發明內容
本發明要解決的技術問題是提供一種基于SIFT特征的優化特征存儲、高效特征匹配的海量圖像實時檢索方法。
為解決目前海量圖像檢索時圖像特征存儲空間大、特征計算復雜度高、檢索速度慢的問題,本發明提供一種基于SIFT特征的海量圖像實時檢索方法,該方法包括如下。
步驟A 圖像的SIFT特征抽取
從圖像檢索的目標出發,微觀上的相似并不能引發人眼視覺上的認同,因此為不影響圖像檢索性能,可以將圖像作一定比例的縮放再進行SIFT特征抽取,例如將圖像面積縮放至25000像素,由此可以減少低層次特征點的個數;
采用SIFT算法的特征抽取4步曲,抽取圖像穩定特征點,并將每一個特征點采用128維的特征向量表示。
步驟B SIFT基因生成
由SIFT算法抽取的圖像特征,每幅圖像大概包含500個左右的特征點,每個特征點128維的向量,由此從存儲的角度看,每幅圖像的SIFT特征達到了500*128*sizeof(double)=500K字節,當前硬件條件下,無法滿足海量圖像檢索需求。
為此,本發明提出SIFT基因的概念,從存儲上看,SIFT基因是一個32位的無符號整型數據,其高26位存儲的是特征點的特征信息(簡稱KEY,對應的是特征點128維向量),低6位存儲的是特征點的重要性程度(簡稱VALUE,由特征點的尺度和相同KEY的出現次數決定)。
B01 生成KEY
采用采用特征降維方法,如主成分分析(簡稱PCA),將SIFT特征的高維向量轉換到低維空間。通過大量的SIFT特征向量訓練,得到(PCA)降維參數,將128維的向量,降低到26維。
對26維向量的每一維進行0、1置標。依次掃描26維向量,對于每一維,如果其值大于0,則置SIFT基因中對應位為1,否則置為0。
B02 生成VALUE
SIFT特征點尺度是指該特征點是在哪個圖像尺度下計算出來的,尺度不同,特征對于圖像檢索的重要程度就存在差異,本發明假設,特征點從原圖計算出來的,其尺度為0,從半圖(長和寬都為原圖一半的圖像),其尺度為1,依次類推。在分辨率為25000像素的情況下,SIFT特征點的尺度取值為0、1、2、3、4、5,對應SIFT基因中后6位存儲位,于是VALUE位對應的取值即反應了該尺度在圖像檢索時的重要程度,例如定義各尺度的VALUE值依次為1、2、4、8、16、32。
B03 特征點壓縮
合并KEY相同的特征點,KEY不變,VALUE相加,由此減少了圖像特征點的數量。
步驟C 圖像特征匹配
將每一幅圖像特征按照SIFT基因中KEY值升序排列,SIFT基因中KEY值相同的特征稱為有效特征,其特征匹配算法的核心思想是兩幅圖像中所有相同KEY對應最小的VALUE值相加即為圖像的相似度,其算法如下所示:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京拓爾思信息技術股份有限公司,未經北京拓爾思信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310346542.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:在數據庫之間進行數據同步的方法及系統
- 下一篇:一種表達式的高亮顯示方法





