[發明專利]一種基于深度CNN特征的圖像檢索和分類方法在審
| 申請號: | 202110629365.0 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113343002A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 鄒送上;陳浩;徐江龍 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F16/51 | 分類號: | G06F16/51;G06F16/53;G06F16/55;G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 湖南楚墨知識產權代理有限公司 43268 | 代理人: | 陳曉娟 |
| 地址: | 410000 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 cnn 特征 圖像 檢索 分類 方法 | ||
本發明提供了一種基于深度CNN特征的圖像檢索和分類方法,其特征在于:該方法流程如下:(1)把查詢圖像輸入CBIR系統內預處理;(2)利用已學習好的CNN提取圖像的特征;(3)特征提取完成后,將信息輸送至檢索模塊;(4)通過稀疏編碼采用余弦距離進行相似性度量;(5)索引和檢索到相關信息,輸出檢索結果;(6)通過CNN的算法,調整CNN的每個參數的學習率,自動提取數據的局部特征,并進行歸檔;本發明方法的網絡特征提取能力比傳統網絡要有所提升,訓練學習到的哈希碼具有較佳的判別力,能夠有效實現對多媒體圖像檢索及特征表達。
技術領域
本發明主要涉及信息檢索的技術領域,具體為一種基于深度CNN 特征的圖像檢索和分類方法。
背景技術
隨著信息技術的發展使得越來越多的物聯網智能設備進入大眾的生活,人們通過這些設備獲取的圖像數據也出現了爆發式的增長,伴隨圖像數據段時間內大幅度增加,傳統圖像檢索已經無法順應時代的發展需求,通過了解發現,以往圖像檢索基本上都是通過數據庫來對數據進行檢索,通過建立索引、分組和關鍵字等手段來獲取符合要求的圖片。隨著智能設備的增多,網絡中的圖像資源劇增,利用傳統的圖像檢索對這些圖像資源進行管理和檢索的效率較低。
發明內容
本發明主要提供了一種基于深度CNN特征的圖像檢索和分類方法,用以解決上述背景技術中提出的技術問題。
本發明解決上述技術問題采用的技術方案為:
一種基于深度CNN特征的圖像檢索和分類方法,該方法流程如下:
(1)把查詢圖像輸入CBIR系統內預處理;
(2)利用已學習好的CNN提取圖像的特征;
(3)特征提取完成后,將信息輸送至檢索模塊;
(4)通過稀疏編碼采用余弦距離進行相似性度量;
(5)索引和檢索到相關信息,輸出檢索結果;
(6)通過CNN的算法,調整CNN的每個參數的學習率,自動提取數據的局部特征,并進行歸檔。
優選的,圖像的特征提取包括單層和多層圖像特征提取,其中單層圖像特提取,稀疏編碼按照由低到高的層次對不同大小的圖像塊依次進行,方法如下:
2.1、圖像從粗到細分為3個不同層次,分別得到大塊、中塊和小塊,首先將它們的灰度值按列重組為一個列向量,列向量的元素為此塊中的像素值;如果是彩色圖像,則將小塊中的像素按列重組后提取R、G、B 3個通道的值得到3個列向量,再將3個列向量連接成為一個長的列向量;
其中多層圖像特征提取,三層圖像特征提取要在3個遞進的層上依次對圖像進行稀疏編碼,方法如下:
2.2、第一層:在第一層的編碼流程與單層的特征提取算法相同,即在圖像分塊后,從小塊開始用之前訓練好的詞典C1進行編碼,對編碼進行匯總得到大塊的編碼,再將大塊的編碼連接得到FB1,FB1 經歸一化處理后輸入到第二層中;
2.3、第二層:將第一層輸出的歸一化后的編碼FB1用第二層訓練好的詞典C2進行進一步的編碼,然后進行匯總、連接和歸一化得到第二層相應的稀疏編碼FB2;
2.4、第三層:將第二層輸出的歸一化后的編碼FB2用第三層訓練好的詞典C3進行進一步的編碼,然后進行匯總、連接和歸一化得到第三層相應的稀疏編碼FB3,更多層可依次類推。
優選的,如果圖像特征向量為圖像B的特征向量為B=(b1,b2,L,bn),A與B之間的距離為d(A,B),ai為特征向量A的第 i維,bi為特征向量B的第i維,那么幾種常用的相似性度量距離方法如下:
3.1、歐式距離法
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110629365.0/2.html,轉載請聲明來源鉆瓜專利網。





