[發(fā)明專利]一種基于混合遷移網(wǎng)絡(luò)的跨媒體檢索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710378474.3 | 申請(qǐng)日: | 2017-05-25 |
| 公開(公告)號(hào): | CN107220337B | 公開(公告)日: | 2020-12-22 |
| 發(fā)明(設(shè)計(jì))人: | 黃鑫;彭宇新 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué) |
| 主分類號(hào): | G06F16/43 | 分類號(hào): | G06F16/43;G06F40/30;G06N5/02 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 混合 遷移 網(wǎng)絡(luò) 媒體 檢索 方法 | ||
1.一種基于混合遷移網(wǎng)絡(luò)的跨媒體檢索方法,包括以下步驟:
(1)建立包含一種媒體類型的單媒體數(shù)據(jù)庫,同時(shí)建立包含多種媒體類型的跨媒體數(shù)據(jù)庫,并將所述跨媒體數(shù)據(jù)庫中的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集;
(2)利用單媒體數(shù)據(jù)庫和跨媒體數(shù)據(jù)庫的訓(xùn)練集中的數(shù)據(jù)訓(xùn)練混合遷移網(wǎng)絡(luò),用于學(xué)習(xí)不同媒體數(shù)據(jù)的統(tǒng)一表征;所述混合遷移網(wǎng)絡(luò)包括媒體共享遷移子網(wǎng)絡(luò)和網(wǎng)絡(luò)層共享關(guān)聯(lián)子網(wǎng)絡(luò);其中媒體共享遷移子網(wǎng)絡(luò)以源域、目標(biāo)域中的共有媒體為橋梁,聯(lián)合進(jìn)行單媒體遷移和跨媒體遷移,使得單媒體源域中的知識(shí)能夠被同時(shí)遷移到目標(biāo)域中的所有媒體;網(wǎng)絡(luò)層共享關(guān)聯(lián)子網(wǎng)絡(luò)則利用網(wǎng)絡(luò)層共享的方式,充分考慮蘊(yùn)含于目標(biāo)域中的跨媒體關(guān)聯(lián)關(guān)系,使得屬于相同語義類別的跨媒體數(shù)據(jù)生成相近的統(tǒng)一表征;
(3)利用訓(xùn)練好的混合遷移網(wǎng)絡(luò),得到跨媒體數(shù)據(jù)庫的測(cè)試集中數(shù)據(jù)的統(tǒng)一表征,進(jìn)而計(jì)算跨媒體數(shù)據(jù)的相似性;
(4)使用跨媒體測(cè)試集中的一種媒體類型作為查詢集,另一種媒體類型作為檢索庫,利用查詢集中的每個(gè)數(shù)據(jù)作為樣例,與檢索庫中的每個(gè)數(shù)據(jù)計(jì)算相似性,根據(jù)相似性得到檢索結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,步驟(1)中的單媒體數(shù)據(jù)庫包括一種媒體類型;跨媒體數(shù)據(jù)庫包括兩種媒體類型,其中一種為單媒體數(shù)據(jù)庫的媒體類型。
3.如權(quán)利要求1所述的方法,其特征在于,步驟(2)中的媒體共享遷移子網(wǎng)絡(luò)共有三路輸入:源域圖像、目標(biāo)域圖像、目標(biāo)域文本,三路輸入分別經(jīng)過兩層全連接網(wǎng)絡(luò)處理;在訓(xùn)練過程中聯(lián)合考慮單媒體遷移和跨媒體遷移兩個(gè)方面來實(shí)現(xiàn)從單媒體源域到跨媒體目標(biāo)域的知識(shí)遷移;所述單媒體遷移發(fā)生在源域圖像和目標(biāo)域圖像兩路網(wǎng)絡(luò)之間,所述跨媒體遷移發(fā)生在目標(biāo)域圖像與目標(biāo)域文本之間。
4.如權(quán)利要求3所述的方法,其特征在于,所述單媒體遷移采用特征適應(yīng)方式進(jìn)行,定義兩個(gè)域中圖像數(shù)據(jù)a與b的最大平均差異在再生希爾伯特空間Hk中的平方形式為:
其中,is和it分別表示源域、目標(biāo)域的輸入圖像,表示深度網(wǎng)絡(luò)中網(wǎng)絡(luò)層的輸出,Ea和Eb表示源域、目標(biāo)域上的期望;
據(jù)此,構(gòu)建單媒體遷移損失項(xiàng)如下:
其中,l6與l7為源域圖像、目標(biāo)域圖像兩路網(wǎng)絡(luò)中對(duì)應(yīng)的全連接層,Is和It分別表示源域、目標(biāo)域的圖像集合;此外,源域圖像網(wǎng)絡(luò)也需要在Is上進(jìn)行微調(diào)以挖掘源域和目標(biāo)域的語義關(guān)聯(lián)信息,為此建立源域監(jiān)督損失項(xiàng):
其中,表示源域中的帶標(biāo)注圖像,為的標(biāo)注標(biāo)簽,θs表示目標(biāo)域分支的網(wǎng)絡(luò)參數(shù),m表示源域中有標(biāo)注的圖像數(shù)量,為softmax損失項(xiàng),定義如下:
其中θ為網(wǎng)絡(luò)參數(shù),y為數(shù)據(jù)x的標(biāo)簽,c為x所有可能的標(biāo)簽數(shù)量;1{y=j(luò)}為指示函數(shù),若y=j(luò)則返回1,否則為0。
5.如權(quán)利要求3所述的方法,其特征在于,所述跨媒體遷移中每個(gè)圖像-文本對(duì)具有相關(guān)的高層語義,因此使它們的網(wǎng)絡(luò)層具有相似的輸出以實(shí)現(xiàn)跨媒體知識(shí)遷移;令每個(gè)圖像-文本對(duì)為定義跨媒體差異如下:
其中,和分別表示一個(gè)圖像-文本對(duì)中帶標(biāo)注的圖像和文本數(shù)據(jù),表示深度網(wǎng)絡(luò)中網(wǎng)絡(luò)層的輸出,據(jù)此建立跨媒體遷移損失項(xiàng)如下:
其中,l6與l7為目標(biāo)域圖像、文本兩路網(wǎng)絡(luò)中對(duì)應(yīng)的全連接層,nl表示目標(biāo)域帶標(biāo)注的圖像-文本對(duì)數(shù)量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué),未經(jīng)北京大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710378474.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 遷移方法和裝置
- 移動(dòng)邊緣系統(tǒng)中遷移應(yīng)用方法、相關(guān)設(shè)備及系統(tǒng)
- 虛擬機(jī)的遷移方法及裝置
- 數(shù)據(jù)遷移方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 計(jì)算任務(wù)遷移方法及計(jì)算任務(wù)遷移器
- 文件遷移方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于遷移工具的國產(chǎn)化應(yīng)用系統(tǒng)遷移方法
- 數(shù)據(jù)遷移方法及裝置
- 文件遷移方法及裝置
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲(chǔ)介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲(chǔ)介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





