[發(fā)明專利]一種基于協(xié)同矩陣分解的跨模態(tài)檢索方法有效
| 申請?zhí)枺?/td> | 201810062484.0 | 申請日: | 2018-01-23 |
| 公開(公告)號: | CN108334574B | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計)人: | 李新衛(wèi);荊曉遠;吳飛;孫瑩 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06F16/583 | 分類號: | G06F16/583;G06F16/33;G06F16/31 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司 32200 | 代理人: | 劉莎 |
| 地址: | 210023 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 協(xié)同 矩陣 分解 跨模態(tài) 檢索 方法 | ||
1.一種基于協(xié)同矩陣分解的跨模態(tài)檢索方法,其特征在于,包括如下步驟:
步驟1,獲取原始數(shù)據(jù),首先對原始數(shù)據(jù)中的圖像和文本分別進行特征提取,并對提取到的圖像特征和文本特征分別進行歸一化處理,再將歸一化處理后的圖像特征和文本特征分別分為兩個部分,一部分圖像特征和文本特征構(gòu)成訓(xùn)練集,另一部分圖像特征和文本特征構(gòu)成測試集;
步驟2,利用訓(xùn)練集中的特征數(shù)據(jù)的類標簽構(gòu)造圖像與圖像、文本與文本模態(tài)內(nèi)以及圖像與文本模態(tài)間相似性矩陣和拉普拉斯矩陣;
步驟3,將矩陣分解函數(shù)、哈希函數(shù)和正則化項合并生成整體目標函數(shù),整體目標函數(shù)的表達式如下所示:
式中,i,j=1,2,λ1和λ2分別表示圖像模態(tài)內(nèi)和文本模態(tài)內(nèi)的平衡系數(shù),X1和X2分別表示訓(xùn)練集中圖像特征數(shù)據(jù)和文本特征數(shù)據(jù),U1和U2分別表示X1和X2的基矩陣,V是成對的圖像和文本在低維潛在語義空間的共同表示,α為哈希函數(shù)學(xué)習時的權(quán)重系數(shù),h(·)表示哈希函數(shù),γ為圖正則化項的加權(quán)系數(shù),tr(·)表示矩陣的跡范數(shù),P1和P2分別表示X1和X2利用哈希函數(shù)所學(xué)習的投影矩陣,L11、L22分別表示圖像與圖像模態(tài)內(nèi)、文本與文本模態(tài)內(nèi)拉普拉斯矩陣,L12=L21表示圖像與文本模態(tài)間的拉普拉斯矩陣,I為單位矩陣;
步驟4,對步驟3生成的整體目標函數(shù)中的變量Ui、V、Pi分別進行迭代更新,直至達到設(shè)定的最大迭代次數(shù),具體為:
(1)將Ui、V、Pi中的所有元素均初始化為(0,1)區(qū)間內(nèi)的隨機數(shù),設(shè)定λi、α、γ的值以及最大迭代次數(shù);
(2)固定V、P1和P2,更新U1、U2:
其中,U1t+1、U1t分別表示第t+1、t次迭代后的U1,U2t+1、U2t分別為第t+1、t次迭代后的U2;η1、η2為平衡參數(shù);
(3)固定U1、U2、P1和P2,利用KKT條件更新V:
其中,Vpqt+1、Vpqt分別表示第t+1、t次迭代后的V中的第p行第q列元素;Vt表示第t次迭代后的V,分別表示U1t、U2t的轉(zhuǎn)置;
(4)固定V、U1和U2,更新P1、P2:
其中,P1t+1、P1t分別表示第t+1、t次迭代后的P1;P2t+1、P2t分別表示第t+1、t次迭代后的P2;
步驟5,利用符號函數(shù)得到訓(xùn)練集中圖像文本統(tǒng)一的哈希編碼矩陣sign(V);
步驟6,根據(jù)投影矩陣P1、P2,將測試集中的圖像特征數(shù)據(jù)X′1、文本特征數(shù)據(jù)X′2代入步驟3中的哈希函數(shù)分別得到X′1、X′2的哈希編碼;
步驟7,分別計算X′1、X′2的哈希編碼與訓(xùn)練集哈希編碼sign(V)之間的漢明距離D1與D2;
步驟8,分別對漢明距離D1與D2進行升序排列,根據(jù)排序結(jié)果找到對應(yīng)的索引,將索引的前K項對應(yīng)的對象作為檢索結(jié)果,并根據(jù)檢索結(jié)果的類標簽計算檢索精度,從而實現(xiàn)以圖檢文和以文檢圖的跨模態(tài)檢索。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810062484.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 移動通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務(wù)協(xié)同流程配置、業(yè)務(wù)協(xié)同方法及裝置
- 一種基于健康檔案共享平臺的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關(guān)的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設(shè)備和介質(zhì)
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無人裝備的時間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)





