[發(fā)明專利]基于對(duì)抗學(xué)習(xí)和語(yǔ)義相似度的社交網(wǎng)絡(luò)跨媒體搜索方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910631327.1 | 申請(qǐng)日: | 2019-07-12 |
| 公開(kāi)(公告)號(hào): | CN110502743A | 公開(kāi)(公告)日: | 2019-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 杜軍平;薛哲;劉翀;周南 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06F17/27 | 分類號(hào): | G06F17/27;G06N3/04;G06Q50/00 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)義相似度 媒體數(shù)據(jù) 媒體搜索 社交網(wǎng)絡(luò) 模態(tài) 圖像 特征提取 文本處理 映射網(wǎng)絡(luò) 語(yǔ)義空間 網(wǎng)絡(luò) 創(chuàng)新性 檢索 文本 對(duì)抗 應(yīng)用 學(xué)習(xí) | ||
本發(fā)明提出了一種基于對(duì)抗學(xué)習(xí)和語(yǔ)義相似度的社交網(wǎng)絡(luò)跨媒體搜索方法,包含文本和圖像的特征提取網(wǎng)絡(luò)、公共語(yǔ)義空間映射網(wǎng)絡(luò)、語(yǔ)義相似度網(wǎng)絡(luò)以及模態(tài)判別網(wǎng)絡(luò),創(chuàng)新性突出,主要用于社交網(wǎng)絡(luò)跨媒體搜索中。本發(fā)明應(yīng)用在圖像以及文本處理領(lǐng)域,可以處理不同模態(tài)下的跨媒體數(shù)據(jù),使得跨媒體數(shù)據(jù)之間的檢索高效并且準(zhǔn)確。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理和文本處理的技術(shù)領(lǐng)域,具體涉及到跨媒體數(shù)據(jù)之間的相互檢索,集成多種技術(shù),如對(duì)抗學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)、語(yǔ)義融合、排序搜索算法等,最終實(shí)現(xiàn)跨媒體數(shù)據(jù)的語(yǔ)義關(guān)聯(lián)以及搜索。
背景技術(shù)
隨著移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,社交網(wǎng)絡(luò)數(shù)據(jù)信息呈現(xiàn)爆炸式增長(zhǎng),越來(lái)越多的用戶在各類社交媒體上發(fā)布大量實(shí)時(shí)信息,其中有關(guān)國(guó)民安全的信息顯得尤為重要。在事故災(zāi)害發(fā)生的時(shí)候,能及時(shí)搜索到和災(zāi)害相關(guān)的文本和圖像,能在一定程度上減小災(zāi)害帶來(lái)的損失。微博是社交網(wǎng)絡(luò)重要的組成部分,具有內(nèi)容短小,傳播快,用戶量大等特點(diǎn)。微博數(shù)據(jù)對(duì)于國(guó)民安全相關(guān)熱點(diǎn)事件內(nèi)容具有敏感性,因此具有非常高的研究?jī)r(jià)值。微博數(shù)據(jù)的形式不僅包括文本,還有圖像和視頻,單一媒體數(shù)據(jù)的搜索已經(jīng)不能很好地滿足現(xiàn)有的社交網(wǎng)絡(luò)信息需求,社交網(wǎng)絡(luò)尤其是基于微博的跨媒體信息搜索的需求與日俱增。
近年來(lái),深度學(xué)習(xí)在文本和圖像領(lǐng)域應(yīng)用十分廣泛,它對(duì)數(shù)據(jù)特征的提取準(zhǔn)確而高效,為跨媒體搜索提供了支持。然而不同模態(tài)之間的數(shù)據(jù)特征分布不同,語(yǔ)義空間不能互通,即包含相同語(yǔ)義內(nèi)容的文本和圖像不能通過(guò)它們所在的語(yǔ)義空間直接建立關(guān)聯(lián)關(guān)系。對(duì)抗學(xué)習(xí)對(duì)于生成一個(gè)新的數(shù)據(jù)分布非常有效,已經(jīng)被廣泛應(yīng)用于文本、圖像、語(yǔ)音的生成。
提出一種基于對(duì)抗學(xué)習(xí)和語(yǔ)義相似度的社交網(wǎng)絡(luò)跨媒體搜索方法(SemanticSimilarity based Adversarial Cross Media Retrieval,SSACR),對(duì)國(guó)民安全相關(guān)的微博文本以及圖像進(jìn)行搜索,并根據(jù)語(yǔ)義相似度進(jìn)行排序。該方法主要使用對(duì)抗訓(xùn)練的方式訓(xùn)練兩個(gè)神經(jīng)網(wǎng)絡(luò)模型,即特征映射網(wǎng)絡(luò)和模態(tài)判別網(wǎng)絡(luò)。特征映射網(wǎng)絡(luò)作為對(duì)抗學(xué)習(xí)的生成器,分別將來(lái)自文本和圖像的特征映射到同一語(yǔ)義空間中,并使用語(yǔ)義及其相似度來(lái)訓(xùn)練特征映射網(wǎng)絡(luò),相似度約束能夠減小同語(yǔ)義下不同模態(tài)數(shù)據(jù)的差異。模態(tài)判別網(wǎng)絡(luò)作為對(duì)抗學(xué)習(xí)判別器,用來(lái)區(qū)分映射到同一語(yǔ)義空間中的數(shù)據(jù)的原本模態(tài),并以數(shù)據(jù)的真實(shí)模態(tài)來(lái)訓(xùn)練模態(tài)判別網(wǎng)絡(luò)。本發(fā)明提出的方法將搜索的文本或圖像經(jīng)過(guò)特征映射網(wǎng)絡(luò)投影到同一語(yǔ)義空間后,根據(jù)和該空間中其他數(shù)據(jù)距離的遠(yuǎn)近來(lái)得到搜索結(jié)果排序。
發(fā)明內(nèi)容
本發(fā)明所提出的基于對(duì)抗學(xué)習(xí)和語(yǔ)義相似度的社交網(wǎng)絡(luò)跨媒體搜索方法(SSACR)包括圖像特征輸入網(wǎng)絡(luò)、文本特征輸入網(wǎng)絡(luò)、特征映射網(wǎng)絡(luò)、語(yǔ)義分布網(wǎng)絡(luò)、語(yǔ)義相似網(wǎng)絡(luò)以及模態(tài)判別網(wǎng)絡(luò)。對(duì)于每一個(gè)圖像-文本-語(yǔ)義三元組,先將圖像和文本的特征進(jìn)行提取,然后分別輸入到圖像特征映射網(wǎng)絡(luò)和文本特征映射網(wǎng)絡(luò)中,語(yǔ)義向量輸入到語(yǔ)義分布網(wǎng)絡(luò)中。語(yǔ)義相似度網(wǎng)絡(luò)對(duì)輸入的語(yǔ)義向量進(jìn)行相似度計(jì)算。特征映射網(wǎng)絡(luò)將圖像和文本特征映射到S中,模態(tài)判別網(wǎng)絡(luò)根據(jù)映射到S數(shù)據(jù)的模態(tài)進(jìn)行判別??傮w流程如圖1所示。
本發(fā)明提出的SSACR方法在公共語(yǔ)義空間S中得到合適的SV和ST,使得它們保持映射前的語(yǔ)義關(guān)系,同時(shí)使得語(yǔ)義相近的不同模態(tài)的數(shù)據(jù)在S中距離較近,相同模態(tài)的不同語(yǔ)義的數(shù)據(jù)在S中距離較遠(yuǎn)。
為達(dá)到上述目的,如圖1所示,本發(fā)明的技術(shù)方案劃分為四個(gè)部分:
1.基于深度卷積網(wǎng)絡(luò)的圖像特征提取;
2.基于TF-IDF的文本特征提?。?/p>
3.基于余弦相似度的跨模態(tài)語(yǔ)義相似度的計(jì)算;
4.基于對(duì)抗網(wǎng)絡(luò)的模態(tài)判別。
本發(fā)明有以下一些技術(shù)特征:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910631327.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種針對(duì)GIS數(shù)據(jù)的建模方法
- 一種改進(jìn)的本體概念語(yǔ)義相似度計(jì)算方法
- 一種基于Word2Vec的中文問(wèn)答語(yǔ)義相似度計(jì)算方法
- 基于深度語(yǔ)義模型與語(yǔ)義角色標(biāo)注的句子相似度評(píng)估方法
- 一種高效的領(lǐng)域本體語(yǔ)義相似度計(jì)算算法
- 一種基于本體語(yǔ)義相似度的醫(yī)學(xué)問(wèn)答方法
- 文本語(yǔ)義相似度的分析方法、裝置及計(jì)算機(jī)設(shè)備
- 語(yǔ)義相似度確定方法、裝置及處理設(shè)備
- 語(yǔ)義相似度任務(wù)模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種語(yǔ)義匹配、語(yǔ)義相似度模型訓(xùn)練方法及裝置
- 數(shù)據(jù)媒體判別信息數(shù)據(jù)庫(kù)生成裝置、管理裝置、記錄介質(zhì)及數(shù)據(jù)媒體判別裝置
- 多媒體文件的產(chǎn)生與播放方法及儲(chǔ)存此文件的記錄媒體
- 流媒體數(shù)據(jù)的傳輸裝置
- 媒體檢索方法
- 一種多媒體數(shù)據(jù)采集方法和系統(tǒng)
- 媒體數(shù)據(jù)播放方法和裝置
- 媒體文件轉(zhuǎn)換方法、裝置及存儲(chǔ)介質(zhì)
- 一種媒體數(shù)據(jù)的播放方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 媒體數(shù)據(jù)推送方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種電子設(shè)備及處理方法
- 對(duì)社交網(wǎng)絡(luò)對(duì)象進(jìn)行排名
- 一種社交網(wǎng)絡(luò)的管理方法、系統(tǒng)和服務(wù)器
- 社交網(wǎng)絡(luò)裝置成員資格和應(yīng)用
- 使用社交網(wǎng)絡(luò)賬號(hào)為游戲網(wǎng)絡(luò)賬號(hào)提供附加功能
- 一種獲取網(wǎng)絡(luò)主體社交關(guān)系類型的方法及裝置
- 預(yù)測(cè)社交網(wǎng)絡(luò)賬戶是否惡意的設(shè)備、方法及系統(tǒng)
- 社交網(wǎng)絡(luò)數(shù)據(jù)的可視化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 動(dòng)態(tài)社交圈確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種面向隱私保護(hù)的網(wǎng)絡(luò)結(jié)構(gòu)去匿名化系統(tǒng)及方法
- 社交網(wǎng)絡(luò)異常用戶檢測(cè)方法、系統(tǒng)、介質(zhì)、設(shè)備、終端





