[發(fā)明專利]基于圖像情感傾向的多模態(tài)謠言檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010940956.5 | 申請(qǐng)日: | 2020-09-09 |
| 公開(kāi)(公告)號(hào): | CN112035670B | 公開(kāi)(公告)日: | 2021-05-14 |
| 發(fā)明(設(shè)計(jì))人: | 毛震東;張勇東;趙博文;付哲仁 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)技術(shù)大學(xué) |
| 主分類號(hào): | G06F16/35 | 分類號(hào): | G06F16/35;G06K9/62;G06N3/08 |
| 代理公司: | 北京凱特來(lái)知識(shí)產(chǎn)權(quán)代理有限公司 11260 | 代理人: | 鄭立明;韓珂 |
| 地址: | 230026 安*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 圖像 情感 傾向 多模態(tài) 謠言 檢測(cè) 方法 | ||
1.一種基于圖像情感傾向的多模態(tài)謠言檢測(cè)方法,其特征在于,包括:
訓(xùn)練階段,利用文本以及包含文字信息的圖像作為訓(xùn)練數(shù)據(jù);對(duì)每一組由文本及圖像構(gòu)成的訓(xùn)練樣本,進(jìn)行多模態(tài)特征的提取,包括:文本特征、圖像特征以及圖像中的文字信息特征;基于條件變分自編碼器,結(jié)合圖像特征、圖像中的文字信息特征、文本特征、語(yǔ)義空間的隱變量,以及給定的情感傾向標(biāo)簽來(lái)更新先驗(yàn)分布及分類器,包括:利用圖像特征I和給定的情感傾向標(biāo)簽Y得到后驗(yàn)分布以及初始化隱變量的先驗(yàn)分布pθ(Z|I),采樣一個(gè)隱變量,結(jié)合文字信息特征O解碼預(yù)測(cè)情感傾向,并計(jì)算出情感傾向標(biāo)簽的重構(gòu)誤差;通過(guò)KL散度最小化后驗(yàn)分布和先驗(yàn)分布的距離,并最小化情感傾向標(biāo)簽Y的重構(gòu)誤差,得到更新后的先驗(yàn)分布pθ(Z|I);從訓(xùn)練好的先驗(yàn)分布pθ(Z|I)中采樣一個(gè)隱變量與文字信息特征O解碼生成情感傾向再與文本特征E拼接在一起輸入到一個(gè)分類器中判別是否為謠言;分類器利用設(shè)定的損失函數(shù)進(jìn)行訓(xùn)練;所述隱變量即為圖像的語(yǔ)義;
測(cè)試階段,對(duì)于待檢測(cè)圖像與相應(yīng)的文本,從圖像中提取出文字信息特征,結(jié)合更新后的先驗(yàn)分布采樣得到的隱變量解碼生成情感傾向,再與文本特征拼接,通過(guò)分類器得到待檢測(cè)圖像為謠言的概率。
2.根據(jù)權(quán)利要求1所述的一種基于圖像情感傾向的多模態(tài)謠言檢測(cè)方法,其特征在于,進(jìn)行多模態(tài)特征的提取之前進(jìn)行數(shù)據(jù)預(yù)處理,包括:
對(duì)于文本進(jìn)行去冗余操作,只保留文字信息,并拼接為文本序列;
對(duì)于圖像,進(jìn)行去噪處理。
3.根據(jù)權(quán)利要求1所述的一種基于圖像情感傾向的多模態(tài)謠言檢測(cè)方法,其特征在于,
通過(guò)預(yù)訓(xùn)練的GLoVe對(duì)文本進(jìn)行詞特征的向量化,并送入GRU進(jìn)行特征提取,獲得的語(yǔ)義向量即為文本特征;
通過(guò)預(yù)訓(xùn)練模型ResneXt提取圖像的通用特征表示,將預(yù)訓(xùn)練模型ResneXt最后一個(gè)池化層輸出的特征,作為圖像特征;
通過(guò)開(kāi)源的中文光學(xué)字符識(shí)別套件CNOCR獲取圖像中的OCR token的集合,集合中包含了圖像中字符的語(yǔ)義信息;再利用預(yù)訓(xùn)練的GLoVe對(duì)文本進(jìn)行向量化,最后經(jīng)線性變換得到文字信息特征。
4.根據(jù)權(quán)利要求1所述的一種基于圖像情感傾向的多模態(tài)謠言檢測(cè)方法,其特征在于,通過(guò)KL散度最小化后驗(yàn)分布和先驗(yàn)分布pθ(Z|I)的距離,從而修正先驗(yàn)分布pθ(Z|I);并且,最小化情感傾向標(biāo)簽Y的重構(gòu)誤差,此過(guò)程的損失函數(shù)為:
上式中,θ,分別代表先驗(yàn)分布和后驗(yàn)分布中的相關(guān)可調(diào)參數(shù),代表情感傾向標(biāo)簽Y的重構(gòu)誤差,p(Y|I)是CVAE損失函數(shù)中固定的形式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)技術(shù)大學(xué),未經(jīng)中國(guó)科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010940956.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種針對(duì)短文本的傾向性分析的系統(tǒng)與方法
- 一種用于確定駕駛員起動(dòng)傾向的系統(tǒng)和方法
- 用于控制車(chē)輛的行駛模式的裝置和方法
- 一種數(shù)據(jù)處理方法和裝置
- 一種基于意群劃分的文本處理技術(shù)方法和系統(tǒng)
- 信息推薦方法、情感傾向確定方法及裝置和電子設(shè)備
- 一種文本信息標(biāo)注的方法以及相關(guān)裝置
- 一種視頻推薦方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 成衣定制方案推薦方法及裝置
- 對(duì)話文本的行為傾向識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





