[發(fā)明專利]一種基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810159590.0 | 申請(qǐng)日: | 2018-02-26 |
| 公開(公告)號(hào): | CN108388639B | 公開(公告)日: | 2022-02-15 |
| 發(fā)明(設(shè)計(jì))人: | 張鴻;代剛 | 申請(qǐng)(專利權(quán))人: | 武漢科技大學(xué) |
| 主分類號(hào): | G06F16/483 | 分類號(hào): | G06F16/483;G06F16/48;G06F16/43 |
| 代理公司: | 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430081 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 空間 學(xué)習(xí) 監(jiān)督 正則 媒體 檢索 方法 | ||
本發(fā)明提供一種基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法,其特征在于,包括步驟:步驟一,建立多媒體數(shù)據(jù)庫,收集多媒體原始數(shù)據(jù);提取多媒體數(shù)據(jù)的特征;保存多媒體數(shù)據(jù)的特征向量和原始數(shù)據(jù);步驟二,獲得不同媒體類型的投影矩陣,定義最優(yōu)化目標(biāo)函數(shù);利用迭代方法求解最優(yōu)化目標(biāo)函數(shù);投影多媒體數(shù)據(jù)的特征向量到共同空間;步驟三,進(jìn)行跨媒體檢索,提取用戶提交的媒體數(shù)據(jù)的特征;投影該媒體數(shù)據(jù)的特征向量到共同空間中;計(jì)算該投影后的向量與共同空間中的其他向量之間的相似度;返回與之相似度最大的前k個(gè)特征向量所對(duì)應(yīng)媒體數(shù)據(jù)。本發(fā)明所提供的跨媒體檢索方法,檢索的結(jié)果更加準(zhǔn)確。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法,屬于數(shù)據(jù)檢索領(lǐng)域。
背景技術(shù)
隨著多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)的高速發(fā)展,文本,圖像,音頻,視頻和3D等非結(jié)構(gòu)化異構(gòu)多媒體內(nèi)容迅速涌入互聯(lián)網(wǎng),使得跨媒體檢索變得尤其重要。跨媒體檢索指的是不同媒體數(shù)據(jù)之間的相互檢索,這使得檢索具有豐富性和多彩性,更好地滿足用戶希望提交任意一種媒體數(shù)據(jù)來檢索出具有相同語義的各種類型(相同類型或不同類型)媒體數(shù)據(jù)的需求。
目前,越來越多的國內(nèi)外學(xué)者致力于研究跨媒體檢索,所提出的方法大致可歸納為以下幾類:深度學(xué)習(xí)、概率模型、度量學(xué)習(xí)方法、子空間學(xué)習(xí)方法等。然而在跨媒體檢索中運(yùn)用子空間學(xué)習(xí)方法主要是為不同模態(tài)學(xué)習(xí)一個(gè)共同的空間,它的做法是將不同模態(tài)空間的特征投影到多模態(tài)共同空間,并獲得跨媒體相似性度量的共同表征。這種方法的優(yōu)勢(shì)在于簡(jiǎn)單明了,適用于任何多種媒體數(shù)據(jù)之間的檢索。缺點(diǎn)是:現(xiàn)有跨媒體檢索方法中大多局限于兩種媒體之間的檢索,以及存在著構(gòu)造近鄰圖的過程中計(jì)算權(quán)值矩陣過于繁瑣的問題。
這些傳統(tǒng)的檢索方法只集中在相同媒體或兩種媒體數(shù)據(jù)之間的檢索,這忽視了多種媒體數(shù)據(jù)之間存在著語義一致性和互補(bǔ)關(guān)系。因此設(shè)計(jì)一種跨媒體檢索方法滿足兩種或兩種以上的媒體數(shù)據(jù)之間相互檢索變得更有意義。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法,以解決上述問題。
本發(fā)明采用了如下技術(shù)方案:
一種基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法,其特征在于,包括步驟:
步驟一,建立多媒體數(shù)據(jù)庫,
收集多媒體原始數(shù)據(jù);提取多媒體數(shù)據(jù)的特征;保存多媒體數(shù)據(jù)的特征向量和原始數(shù)據(jù);
步驟二,獲得不同媒體類型的投影矩陣,
定義最優(yōu)化目標(biāo)函數(shù);利用迭代方法求解最優(yōu)化目標(biāo)函數(shù);投影多媒體數(shù)據(jù)的特征向量到共同空間;
步驟三,進(jìn)行跨媒體檢索,
提取用戶提交的媒體數(shù)據(jù)的特征;投影該媒體數(shù)據(jù)的特征向量到共同空間中;計(jì)算該投影后的向量與共同空間中的其他向量之間的相似度;返回與之相似度最大的前k個(gè)特征向量所對(duì)應(yīng)媒體數(shù)據(jù)。
本發(fā)明的基于子空間學(xué)習(xí)與半監(jiān)督正則化的跨媒體檢索方法,還具有這樣的特征:
其中,步驟二中,定義最優(yōu)化目標(biāo)函數(shù)的方法如下:
最優(yōu)化目標(biāo)函數(shù)包括四個(gè)組成部分,最優(yōu)化目標(biāo)函數(shù)的第一個(gè)組成部分:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢科技大學(xué),未經(jīng)武漢科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810159590.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





