[發明專利]基于字典對學習的哈希跨模態信息檢索方法在審
| 申請號: | 202010822181.1 | 申請日: | 2020-08-16 |
| 公開(公告)號: | CN111984800A | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 王磊;閔康凌;李丹萍;史凌峰 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F16/435 | 分類號: | G06F16/435;G06F16/9536;G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 田文英;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 字典 學習 哈希跨模態 信息 檢索 方法 | ||
1.一種基于字典對學習的哈希跨模態信息檢索方法,其特征在于:對兩種不同物理形態的模態數據構建各自模態的字典對,將不同模態數據通過字典對變換得到兩種不同模態的數據的嵌入系數,將不同模態的數據的嵌入系數映射至漢明空間,該方法的步驟包括如下:
(1)生成訓練集:
隨機選取兩種不同物理形態的模態數據及其與每種模態對應物品的類別標簽矩陣,對兩種模態數據的特征矩陣做均一化處理后組成訓練集,其中,兩種模態數據的標簽矩陣一致;
(2)構造基于字典對學習的哈希目標函數Q:
其中,min(·)表示取最小值操作,||·||F表示取F范數操作,Y表示兩種不同模態數據一致的標簽矩陣,W表示通過最優方向法優化目標函數Q待獲取的線性分類器,(·)T表示轉置操作,B表示哈希碼矩陣,X表示數據集中兩種不同模態中的一種模態數據的特征矩陣,Dx表示通過最優方向法優化目標函數Q待獲取的特征矩陣X的合成字典,Px表示通過最優方向法優化目標函數Q待獲取的特征矩陣X的解析字典,特征矩陣X的合成字典和解析字典構成該模態的字典對,H表示數據集中兩種不同模態中的另一種模態數據的特征矩陣,Dh表示通過最優方向法優化目標函數Q待獲取的特征矩陣H的合成字典,特征矩陣H的合成字典和解析字典構成該模態的字典對,Ph表示通過最優方向法優化目標函數Q待獲取的特征矩陣H的解析字典,Zx表示通過最優方向法優化目標函數Q待獲取的特征矩陣X的系數嵌入矩陣,Zh表示通過最優方向法優化目標函數Q待獲取的特征矩陣H的系數嵌入矩陣,Pxb表示通過最優方向法優化目標函數Q系數待獲取的嵌入矩陣Zx對應的投影矩陣,Phb表示通過最優方向法優化目標函數Q待獲取的系數嵌入矩陣Zh對應的投影矩陣,μX、μH、γX、γH、λX和λH表示折衷參數,α表示防止W,Pxb,Phb過擬合的約束參數,s.t.表示約束條件,||·||2表示2范數操作,表示合成字典Dx中的第i列數據,i=1,2,…,nx,nx表示合成字典Dx列的總數,表示合成字典Dh中的第j列數據,j=1,2,…,nh,nh表示合成字典Dh列的總數;
(3)優化哈希目標函數:
(3a)用單位矩陣分別對線性分類器W、合成字典Dx、解析字典Px、系數嵌入矩陣Zx、合成字典Dh、解析字典Ph、系數嵌入矩陣Zh、投影矩陣Pxb和投影矩陣Phb進行初始化;
(3b)對目標函數中的線性分類器W、合成字典Dx、解析字典Px、系數嵌入矩陣Zx、合成字典Dh、解析字典Ph、系數嵌入矩陣Zh、投影矩陣Pxb、投影矩陣Phb和哈希碼矩陣B分別求一階導數,將求導后的矩陣帶入到目標函數中,得到更新后的目標函數值;
(3c)判斷更新后的目標函數是否收斂,若是,則得到訓練集的哈希碼矩陣并執行步驟(4),否則,執行步驟(3b);
(4)將兩種和訓練集相同模態的數據及其與每種模態對應的物品的類別標簽矩陣組成待檢索樣本集,利用與步驟(3)優化哈希目標函數的相同方法,對待檢索的樣本集做字典對變換,得到待檢索的哈希碼矩陣;
(5)得到跨模態檢索結果:
(5a)對待檢索的哈希碼矩陣和訓練集的哈希碼矩陣進行異或操作,得到兩個哈希碼矩陣的漢明距離;
(5b)對兩個哈希碼矩陣的漢明距離按照升序進行排列,將前50個漢明距離對應的標簽作為檢索結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010822181.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種橡膠生產用切膠機
- 下一篇:一種板材加工設備及其工作方法





