[發明專利]一種基于GPU加速的大規模圖像詞匯樹檢索方法及系統有效
| 申請號: | 201710068307.9 | 申請日: | 2017-02-08 |
| 公開(公告)號: | CN106919658B | 公開(公告)日: | 2019-09-27 |
| 發明(設計)人: | 陶文兵;徐青山;孫琨;李杰 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06K9/46 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 gpu 加速 大規模 圖像 詞匯 檢索 方法 系統 | ||
1.一種基于GPU加速的大規模圖像詞匯樹檢索方法,其特征在于,該方法包括以下步驟:
(1)輸入待查詢圖像;
(2)利用圖像中每個SIFT特征點在詞匯樹中最相似視覺詞匯構建每幅圖像的圖像直方圖,并對圖像直方圖進行緊湊化處理,同時建立圖像索引列表和視覺詞匯索引列表;
(3)利用視覺詞匯在圖像數據庫中的權重更新視覺詞匯索引列表和圖像索引列表中視覺詞匯出現的頻數,具體采用以下公式更新:
qi=niωi,
其中,qi表示一幅圖像中第i個視覺詞匯的新頻數;ni代表一幅圖像中第i個視覺詞匯的原頻數,ωi為相應視覺詞匯的權重;最后采用L1范數對圖像索引列表進行計算,得到每幅圖像的描述符長度,并以此長度對每幅圖像直方圖進行歸一化;
(4)利用待查詢圖像直方圖和預先準備的數據庫圖像直方圖,采用直方圖交叉核計算所有數據庫圖像和待查詢圖像的相似性,對所有數據庫圖像的相似性進行排序,得到和待查詢圖像相似性最高的數據庫圖像;所述采用直方圖交叉核計算所有數據庫圖像和待查詢圖像的相似性具體為采用以下公式:
其中,h1和h2分別表示待查詢圖像和數據庫圖像的描述直方圖,I(h1,h2)表示相似性,h1(i)和h2(i)分別表示待查詢圖像直方圖和數據庫圖像直方圖第i個視覺詞匯的最終頻數;
所述詞匯樹的結構為地址連續的數組結構,采用廣度優先搜索結合堆棧的方法將視覺詞匯的樹結構轉換為地址連續的數組結構,用數組的一個元素表示詞匯樹的一個節點;所述數組結構的一個元素包括SIFT特征描述符、節點ID、該節點的子節點數和其第一個子節點的地址偏移量屬性。
2.根據權利要求1所述的一種大規模圖像詞匯樹檢索方法,其特征在于,所述步驟(4)中預先準備的數據庫圖像直方圖具體采用以下步驟獲得:
(21)批量輸入數據庫圖像;
(22)利用圖像中SIFT特征點在詞匯樹中找出最相似視覺詞匯構建每幅圖像的圖像直方圖,并對圖像直方圖進行緊湊化處理,同時建立圖像索引列表和視覺詞匯索引列表;
(23)根據視覺詞匯索引列表的數據,采用以下公式計算每個視覺詞匯在圖像數據庫中的權重:
其中,N代表圖像數據庫中所有圖像總數目,Ni代表第i個視覺詞匯下對應有多少幅數據庫圖像與其相關,ωi為第i個視覺詞匯的權重,當Ni為0時,記ωi為0;
(24)利用視覺詞匯在圖像數據庫中的權重更新視覺詞匯索引列表和圖像索引列表中視覺詞匯出現的頻數;最后采用L1范數對圖像索引列表進行計算,得到每幅數據庫圖像的描述符長度,并以此長度對每幅數據庫圖像直方圖進行歸一化。
3.根據權利要求1或2所述的一種大規模圖像詞匯樹檢索方法,其特征在于,所述視覺詞匯索引列表以視覺詞匯為關鍵字,索引包含該視覺詞匯的圖像ID和該視覺詞匯在該圖像中出現的頻數;圖像索引列表以圖像ID為關鍵字,索引該圖像包含的視覺詞匯ID和該視覺詞匯在該圖像中出現的頻數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710068307.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種在線值機自動推選座位的方法及裝置
- 下一篇:一種計算網頁排名的方法及系統





