[發(fā)明專利]基于卷積神經網絡和監(jiān)督核哈希的目標檢索方法在審
| 申請?zhí)枺?/td> | 201810157751.2 | 申請日: | 2018-02-24 |
| 公開(公告)號: | CN108304573A | 公開(公告)日: | 2018-07-20 |
| 發(fā)明(設計)人: | 李弼程;趙永威;朱彩英;陳良浩 | 申請(專利權)人: | 江蘇測聯(lián)空間大數(shù)據(jù)應用研究中心有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215000 江蘇省蘇州市高*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積神經網絡 目標檢索 哈希 檢索 圖像數(shù)據(jù) 哈希碼 監(jiān)督 哈希函數(shù)構造 相似性信息 等價關系 漢明距離 結合訓練 目標函數(shù) 圖像索引 圖像特征 網絡結構 訓練圖像 大數(shù)據(jù) 引入 高階 高維 內積 隱式 學習 分辨 圖像 | ||
1.一種基于卷積神經網絡和監(jiān)督核哈希的目標檢索方法,其特征是,包括以下步驟:
(1)引入卷積神經網絡對訓練圖像進行學習,利用其特殊網絡結構隱式地學習得到圖像數(shù)據(jù)的高階表示,生成深層特征;
(2)引入增強對線性不可分數(shù)據(jù)的分辨力的監(jiān)督核哈希方法,同時利用哈希碼內積與漢明距離的等價關系提出目標函數(shù),并結合訓練圖像的相似性信息對高維圖像特征進行監(jiān)督學習,并生成哈希碼;
(3)利用已訓練好的哈希函數(shù)構造圖像索引,實現(xiàn)對大規(guī)模圖像數(shù)據(jù)的檢索。
2.根據(jù)權利要求1所述的基于卷積神經網絡和監(jiān)督核哈希的目標檢索方法,其特征在于:所述卷積神經網絡的輸入圖像大小為227×227,輸出為4096×1的圖像深層特征,一共包含5個卷積層、3個子采樣層;在卷積層前一層的特征圖與可學習的卷積核Kij進行卷積,卷積的結果經非線性函數(shù)f(·)生成這一層的特征圖具體形式如下:
公式一:
為第l個卷積層Cl的輸出,代表卷積運算,bj為偏置,卷積核Kij可與前一層的一個或多個特征圖確定卷積關系,Mj代表輸入特征圖集合,常用的非線性函數(shù)有f(x)=tanh(x)和f(x)=(1+e-x)-1,卷積層生成的特征圖大小hl可由公式二進行計算:
公式二:
hl-1為第l-1層特征圖的大小,zl表示第l層卷積核的大小,λl是卷積核移動步長,ρl表示卷積運算時對前一層特征圖邊緣補零的列數(shù);各層卷積核大小Z={z1=11,z2=5,z3=z4=z5=3},移動步長Λ={λ1=4,λ2=λ3=λ4=λ5=1},特征圖邊緣補零列數(shù)P={ρ1=0,ρ2=2,ρ3=ρ4=ρ5=1};子采樣層采用重疊采樣方法對特征圖進行最大值采樣,采樣區(qū)域為3×3,采樣步長為2個像素;
卷積神經網絡的訓練主要分前向傳播和后向傳播兩個階段:
前向傳播階段:從訓練樣本中選取一個樣本(X,Yp),X從輸入層經逐級變換傳送到輸出層,計算相應的實際輸出:
公式三:Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))
后向傳播階段:該階段為誤差傳播階段,計算實際輸出Op與對應理想輸出Yp的誤差:
公式四:
將誤差Ep反向逐層后推得到各層的誤差,并按最小化誤差方法調整神經元權值,當總誤差E≤ε時,完成該批次訓練樣本的訓練,當所有批次訓練完成后,將圖像輸入卷積神經網絡中,圖像數(shù)據(jù)逐級通過各個網絡層后,在輸出端即可得到圖像的深層特征。
3.根據(jù)權利要求1所述的基于卷積神經網絡和監(jiān)督核哈希的目標檢索方法,其特征在于:度量圖像之間距離時,給定所述哈希碼的維數(shù)r,則需要r個系數(shù)向量a1,…,ar構造哈希函數(shù)訓練圖像的標簽信息可通過圖像的語義相關性和空間距離獲得,定義為描述標簽圖像集χl={x1,…,xl}中元素之間的相互關系的監(jiān)督矩陣
公式五:
使得圖像xi,xj的漢明距離Dh(xi,xj)滿足:
公式六:
利用向量內積運算計算哈希碼距離,圖像x的哈希碼coder(x)=[h1(x),…,hr(x)]∈{1,-1}1×r,則圖像xi,xj的距離計算如公式十一所示:
公式七:
D(xi,xj)∈[-r,r],對D(xi,xj)歸一化后得到定義使得相似矩陣與監(jiān)督矩陣S距離最小的目標函數(shù):
公式八:
表示求矩陣Frobenius范數(shù),為標簽圖像集χl的哈希碼矩陣,將sgn(·)推廣到矩陣形式,根據(jù)公式(3)Hl可表示成:
公式九:
將Hl代入公式八得
公式十:
公式十一:
定義矩陣其中R0=rS,則可通過貪婪算法最小化式(11)逐步估算ak:
公式十二:
去掉常數(shù)項,可以得到更簡潔的目標函數(shù):
公式十三:
用替換sgn(x),則近似目標函數(shù)如式十四所示:
公式十四:
可通過梯度下降法對最小化,關于ak求梯度得:
公式十五:
表示Hadamard內積運算,為加速收斂而用譜哈希中的譜分析方法生成初始值再加速梯度尋優(yōu)過程,得到哈希函數(shù)H和哈希表H后,對查詢圖像的深層特征進行哈希映射得到coder(xq),計算coder(xq)與哈希表H中哈希碼的距離,返回距離較近的圖像作為檢索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇測聯(lián)空間大數(shù)據(jù)應用研究中心有限公司,未經江蘇測聯(lián)空間大數(shù)據(jù)應用研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810157751.2/1.html,轉載請聲明來源鉆瓜專利網。





