[發(fā)明專利]一種基于多區(qū)域交叉權值的圖像卷積特征的生成方法有效
| 申請?zhí)枺?/td> | 201710776735.7 | 申請日: | 2017-08-31 |
| 公開(公告)號: | CN107577758B | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設計)人: | 董榮勝;程德強;李鳳英 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06F16/58 | 分類號: | G06F16/58;G06N3/04 |
| 代理公司: | 桂林市持衡專利商標事務所有限公司 45107 | 代理人: | 陳躍琳 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 區(qū)域 交叉 圖像 卷積 特征 生成 方法 | ||
本發(fā)明公開一種基于多區(qū)域交叉權值的圖像卷積特征的生成方法,在K個特征圖中模糊地標記出目標位置,利用得到的目標位置和深度卷積特征計算空間權重圖;計算K個特征圖在不同尺度下的區(qū)域大小,分別計算不同區(qū)域下的空間權重、通道權重和區(qū)域權重;針對每個區(qū)域利用交叉權重進行聚合操作,并將多個區(qū)域的特征向量相加,得到圖像的K維特征表示。本發(fā)明生成的圖像特征表示,在應用于檢索任務表現(xiàn)出明顯優(yōu)勢,較好地突出圖片目標區(qū)域,同時抑制了背景噪聲區(qū)域,將該圖像描述符應用于圖像檢索,能夠提高檢索準確率,達到精確檢索的目的。
技術領域
本發(fā)明涉及圖像檢索技術領域,具體涉及一種基于多區(qū)域交叉權值的圖像卷積特征的生成方法。
背景技術
隨著移動互聯(lián)網的飛速發(fā)展和智能設備的廣泛普及,用戶每天都會上傳下載海量的圖像。一方面,越來越多的圖像豐富了互聯(lián)網上的圖像資源,給人們帶來了各種便利;另一方面,隨著圖像資源的爆炸式增長,也給人們帶來了很多問題,用戶難以有效地在海量的數(shù)據(jù)中準確地找到自己真正需要的信息。如何有效地組織、表達及檢索圖像,以便于用戶可以從大量的圖像數(shù)據(jù)中高效、快速地找到圖像數(shù)據(jù)。
基于內容的圖像檢索(Content-based Image Retrieval,CBIR)是由Kato T在1992年提出的。在過去的幾年中,CBIR系統(tǒng)主要利用圖像的視覺內容提取出圖像的包括SIFT、SURF、HOG和GIST等特征,將其存入圖像特征庫。當用戶輸入查詢圖像進行檢索時,提取待查詢圖像的特征向量,將此特征向量與特征庫進行相似度計算,從而得到檢索結果。因此,CBIR中最核心的就是圖像的特征表示,優(yōu)秀的特征表示可以提供更高的檢索準確率。
最近幾年,由于深度學習的發(fā)展,卷積神經網絡(CNN)在計算機視覺領域取得了重要進展,利用深度學習的網絡特征進行圖像的特征表示成為了一種主流方向。然而目前CNN特征描述符在“以圖搜圖”應用場景下存在準確率低的不足。
發(fā)明內容
本發(fā)明所要解決的是目前CNN特征描述符在“以圖搜圖”應用場景下準確率低的問題,提供一種基于多區(qū)域交叉權值的圖像卷積特征的生成方法,使得特征更緊湊、更具有區(qū)分性和魯棒性。
為解決上述問題,本發(fā)明是通過以下技術方案實現(xiàn)的:
一種基于多區(qū)域交叉權值的圖像卷積特征的生成方法,包括如下步驟:
步驟1、選擇任意一種用于分類后的卷積神經網絡模型,在網絡中截斷分類的步驟即全連接層,保證網絡模型對圖像尺寸不具有約束;
步驟2、將原始圖像輸入到卷積神經網絡模型中,提取原始圖像的特征圖X;
步驟3、從橫截面角度匯聚特征圖,將特征圖由三維特征圖X壓縮成二維特征圖M;并在特征圖M上利用該特征圖的均值模糊地標記出目標的大致位置,得到關于特征圖M的掩碼圖Mask;
步驟4、將特征圖M減去其均值得到新的特征圖并將新的特征圖與掩碼圖Mask經過加權后,生成關于特征圖M的空間權重圖Sal;
步驟5、對于特征圖M,在每個尺度上進行均勻采樣,實現(xiàn)特征圖M的區(qū)域劃分;
步驟6、根據(jù)空間權重圖Sal,計算區(qū)域空間權重Sali、區(qū)域權重wi和通道權重Channelj;
步驟7、根據(jù)區(qū)域空間權重Sali、區(qū)域權重wi和通道權重Channelj,交叉聚合特征圖X,生成新的圖像特征表示;
上述i∈[1,N],N表示劃分區(qū)域的總數(shù),j∈[1,K],K表示通道的總數(shù)。
上述步驟3中,掩碼圖Mask為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710776735.7/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





