[發明專利]一種基于深度學習的跨模態哈希檢索方法有效
| 申請號: | 201910196009.7 | 申請日: | 2019-03-14 |
| 公開(公告)號: | CN110019652B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 董西偉;鄧安遠;周軍;楊茂保;孫麗;胡芳;賈海英;王海霞 | 申請(專利權)人: | 九江學院 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/51 |
| 代理公司: | 湖北創融藍圖知識產權代理事務所(特殊普通合伙) 42276 | 代理人: | 羊淑梅 |
| 地址: | 332000 *** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 跨模態哈希 檢索 方法 | ||
1.一種基于深度學習的跨模態哈希檢索方法,假設n個對象的圖像模態的像素特征向量集為其中,vi表示第i個對象在圖像模態的像素特征向量;令表示這n個對象在文本模態的特征向量,其中,ti表示第i個對象在文本模態的特征向量;將n個對象的類別標記向量表示為其中,c表示對象類別的數量;對于向量yi來說,如果第i個對象屬于第k類,則令向量yi的第k個元素為1,否則,向量yi的第k個元素為0;其特征在于,該方法包括以下步驟:
(1)使用基于深度學習技術設計的目標函數得到圖像模態和文本模態共享的二進制哈希編碼B,圖像模態和文本模態的深度神經網絡參數θv和θt,以及圖像模態和文本模態的投影矩陣Pv和Pt;
(2)使用交替求解的方式求解目標函數中的未知變量B、θv、θt、Pv和Pt,即交替的求解如下三個子問題:固定B、Pv和Pt,求解θv和θt;固定B、θv和θt,求解Pv和Pt;固定θv、θt、Pv和Pt,求解B;
(3)基于求解得到的圖像模態和文本模態的深度神經網絡參數θv和θt,以及投影矩陣Pv和Pt,為查詢樣本和檢索樣本集中的樣本生成二進制哈希編碼;
(4)基于生成的二進制哈希編碼計算查詢樣本到檢索樣本集中各個樣本的漢明距離;
(5)使用基于近似最近鄰搜索的跨模態檢索器完成對查詢樣本的檢索;
所述步驟(1)中的基于深度學習技術設計的目標函數形式如下:
其中,γ1和γ2為非負平衡因子,B=[b1,b2,…,bn]T∈{-1,+1}n×k,和為投影矩陣,θv和θt為深度神經網絡參數,和分別為n個對象在圖像模態和文本模態的深度特征,并且矩陣F和矩陣G的第i列的向量分別為f(vi;θv)和g(ti;θt),為拉普拉斯矩陣用于保持模態內一致性和模態間的一致性,1為全部元素為1的列向量,||·||F表示矩陣的Frobenius范數,tr(·)表示矩陣的跡,(·)T表示矩陣的轉置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于九江學院,未經九江學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910196009.7/1.html,轉載請聲明來源鉆瓜專利網。





