[發(fā)明專利]一種基于耦合鑒別性字典的跨媒體哈希索引方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410532084.3 | 申請(qǐng)日: | 2014-10-10 |
| 公開(公告)號(hào): | CN104317838A | 公開(公告)日: | 2015-01-28 |
| 發(fā)明(設(shè)計(jì))人: | 湯斯亮;邵健;余宙;吳飛;莊越挺 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 張法高 |
| 地址: | 310027 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 耦合 鑒別 字典 媒體 索引 方法 | ||
1.一種基于耦合鑒別性字典的跨媒體哈希索引方法,其特征在于包括如下步驟:
1)基于圖結(jié)構(gòu)對(duì)多個(gè)模態(tài)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系進(jìn)行建模;通過數(shù)據(jù)底層特征之間的歐氏距離確定同一模態(tài)內(nèi)部的相似性,利用不同模態(tài)數(shù)據(jù)已知關(guān)聯(lián)關(guān)系確定模態(tài)間的關(guān)聯(lián),利用數(shù)據(jù)所具有類別標(biāo)簽信息增強(qiáng)圖結(jié)構(gòu)上數(shù)據(jù)的鑒別性;
2)在步驟1)中得到的圖結(jié)構(gòu)上數(shù)據(jù)的關(guān)聯(lián)關(guān)系學(xué)習(xí)鑒別性的耦合字典;
3)利用步驟2)中學(xué)習(xí)得到的耦合字典對(duì)不同模態(tài)的數(shù)據(jù)進(jìn)行稀疏編碼,并映射到統(tǒng)一的字典空間內(nèi);
4)學(xué)習(xí)從字典空間到二值海明空間的哈希映射函數(shù)。
2.根據(jù)權(quán)利要求1所述的一種基于耦合鑒別性字典的跨媒體哈希索引方法,其特征在于所述的步驟2)包括:
將步驟1)得到的圖結(jié)構(gòu)形式化表達(dá)為G(V,E,w,C);其中V為圖結(jié)構(gòu)中的頂點(diǎn)集合,代表不同模態(tài)所對(duì)應(yīng)的數(shù)據(jù)對(duì)象,E是圖結(jié)構(gòu)中邊的集合,代表了每個(gè)頂點(diǎn)之間的關(guān)聯(lián)關(guān)系,w為邊的權(quán)重集合,C為每個(gè)頂點(diǎn)對(duì)應(yīng)的標(biāo)簽信息的集合;
得到圖結(jié)構(gòu)G(V,E,w,C)后,基于圖分割方法,給出了鑒別性耦合字典學(xué)習(xí)問題的解決方法:從邊的集合E中選擇合適的子集A,將圖G分割成K個(gè)子圖,將每個(gè)子圖中所包含數(shù)據(jù)對(duì)象的質(zhì)心選擇出來,形成一組耦合字典,假設(shè)總共有M個(gè)模態(tài)數(shù)據(jù),就得到了M個(gè)耦合字典D1,D2,...,DM,每個(gè)字典中所包含的字典項(xiàng)個(gè)數(shù)都為K;
為了得到合適的子集A,設(shè)計(jì)了具有亞模性質(zhì)的三個(gè)函數(shù),這三個(gè)亞模函數(shù)分別具有如下壓縮性、鑒別性和平衡性;
壓縮函數(shù):基于隨機(jī)游走模型中的“熵率”,設(shè)計(jì)了壓縮函數(shù),該函數(shù)使得每個(gè)子圖中的媒體對(duì)象之間距離盡可能近,從而使得每個(gè)子圖都具有“緊湊”特性,即
H(A)=-∑iμi∑jPi,j(A)logPi,j(A)???(1)其中μi為頂點(diǎn)i穩(wěn)態(tài)分布的概率,Pi,j(A)為頂點(diǎn)i到j(luò)的傳遞概率函數(shù),定義如下:
鑒別函數(shù):為了使每個(gè)字典項(xiàng)具有鑒別性,每個(gè)子圖中的媒體對(duì)象應(yīng)該盡可能具有相同的標(biāo)簽,鑒別函數(shù)定義如下:
其中NA為當(dāng)選出的邊的子集A時(shí)所對(duì)應(yīng)圖G被分割出子圖的個(gè)數(shù);|V|表示頂點(diǎn)集合中頂點(diǎn)的個(gè)數(shù),表示第i個(gè)子圖中標(biāo)簽為y的媒體對(duì)象個(gè)數(shù);
平衡函數(shù):為了防止出現(xiàn)子圖所包含媒體對(duì)象個(gè)數(shù)不均衡的過擬合現(xiàn)象,即某些子圖可能包含很多媒體對(duì)象而一些子圖僅包含有限媒體對(duì)象,從最大信息熵角度來如下定義平衡函數(shù):
B(A)=-∑ipA(i)log(pA(i))-NA???(4)
其中
將如下三個(gè)函數(shù)結(jié)合起來,使用如下目標(biāo)函數(shù)來學(xué)習(xí)得到合適的子集A,即產(chǎn)生合適的子圖:
maxAH(A)+λD(A)+γB(A)???(5)
λ和γ為調(diào)節(jié)它們所對(duì)應(yīng)函數(shù)權(quán)重的超參數(shù),這些參數(shù)可通過參數(shù)優(yōu)化調(diào)節(jié)過程來獲得。
3.根據(jù)權(quán)利要求1所述的一種基于耦合鑒別性字典的跨媒體哈希索引方法,其特征在于所述的步驟4)包括:
為了將K維稀疏編碼轉(zhuǎn)化為L(zhǎng)維二值海明編碼,從而高效進(jìn)行媒體對(duì)象檢索,需要學(xué)習(xí)將媒體對(duì)象從字典空間映射到海明空間的哈希函數(shù);假設(shè)Z=[Z1,Z2,...,ZM]為具有M種模態(tài)類型的訓(xùn)練數(shù)據(jù)在字典空間中的稀疏編碼集合,構(gòu)建近似近鄰矩陣其中Λ=diag(Z1)為對(duì)角矩陣,由于近鄰矩陣具有非負(fù)、稀疏以及低秩特性,對(duì)進(jìn)行特征值分解后,選取前L個(gè)最大特征值以及它們各自所對(duì)應(yīng)特征向量則學(xué)習(xí)得到的哈希函數(shù)定義如下:
h(z)=sign(PTz)???(6)
其中P=Λ-1/2VΣ-1/2∈RK×L為將媒體對(duì)象從K維字典空間映射到到L維海明空間的投影矩陣,V=[v1v2,...,vL]∈RK×L,∑=diag(σ1,σ2,...,σL)∈RL×L,sign(·)為閾值為0的二值化函數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410532084.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種電子字典數(shù)據(jù)更新系統(tǒng)及其方法
- 一種階梯字典
- 一種基于網(wǎng)絡(luò)字典的無損數(shù)據(jù)壓縮方法
- 數(shù)據(jù)冗余消除DRE字典確認(rèn)方法和設(shè)備
- 一種對(duì)字典和字典項(xiàng)進(jìn)行處理的方法及服務(wù)器
- 一種數(shù)據(jù)字典的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于深度矩陣字典的字典學(xué)習(xí)方法
- 一種字典轉(zhuǎn)碼方法、裝置、存儲(chǔ)介質(zhì)及終端
- 一種基于不相干性聯(lián)合字典學(xué)習(xí)的圖像分類方法
- 一種基于Kubernetes容器配置字典和保密字典的實(shí)現(xiàn)方法及其系統(tǒng)





