[發(fā)明專(zhuān)利]一種基于多模態(tài)識(shí)別視頻情感信息的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110056309.2 | 申請(qǐng)日: | 2021-01-15 |
| 公開(kāi)(公告)號(hào): | CN112733764A | 公開(kāi)(公告)日: | 2021-04-30 |
| 發(fā)明(設(shè)計(jì))人: | 聶為之;任敏捷;劉安安;張勇東 | 申請(qǐng)(專(zhuān)利權(quán))人: | 天津大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專(zhuān)利代理事務(wù)所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多模態(tài) 識(shí)別 視頻 情感 信息 方法 | ||
1.一種基于多模態(tài)識(shí)別視頻情感信息的方法,其特征在于,所述方法包括:
獲取每個(gè)視頻片段的語(yǔ)音信號(hào)并提取每個(gè)視頻片段的關(guān)鍵幀;根據(jù)所得每個(gè)視頻的語(yǔ)音信號(hào)和關(guān)鍵幀分別提取特征;
對(duì)所得的語(yǔ)音特征和關(guān)鍵幀特征進(jìn)行融合得到每個(gè)視頻特征描述符;根據(jù)視頻特征描述符建立關(guān)系圖;
根據(jù)關(guān)系圖,通過(guò)多頭注意力構(gòu)造多個(gè)全連接圖,生成多分支圖卷積網(wǎng)絡(luò);對(duì)構(gòu)造的每個(gè)全連接圖,即為多分支圖卷積網(wǎng)絡(luò)中的每個(gè)分支,分別作圖卷積更新節(jié)點(diǎn)特征;
將多個(gè)全連接圖的更新后的節(jié)點(diǎn)特征進(jìn)行融合,生成唯一的節(jié)點(diǎn)特征即最終所得的包含視頻間關(guān)聯(lián)性的視頻特征描述符;
對(duì)最終的視頻特征描述符進(jìn)行分類(lèi)得到每個(gè)視頻所屬的情感類(lèi)別。
2.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)識(shí)別視頻情感信息的方法,其特征在于,關(guān)系圖的構(gòu)建基于視頻特征描述符之間的相似度,相似度計(jì)算為:
其中,f1和f2分別為視頻V1和V2對(duì)應(yīng)的特征。
3.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)識(shí)別視頻情感信息的方法,其特征在于,所述根據(jù)關(guān)系圖,通過(guò)多頭注意力構(gòu)造多個(gè)全連接圖具體為:
其中,Q和K都為節(jié)點(diǎn)特征,A是原始關(guān)系圖G的鄰接矩陣,h為超參數(shù)用于防止點(diǎn)積維度過(guò)大將softmax函數(shù)推到它的梯度極小的區(qū)域,T代表轉(zhuǎn)置,softmax( )為歸一化指數(shù)函數(shù)。
4.根據(jù)權(quán)利要求1所述的一種基于多模態(tài)識(shí)別視頻情感信息的方法,其特征在于,所述將多個(gè)全連接圖的更新后的節(jié)點(diǎn)特征進(jìn)行融合,生成唯一的節(jié)點(diǎn)特征具體為:
將深度連接引入到全連接圖更新節(jié)點(diǎn)特征的過(guò)程中,獲得了n個(gè)不同的嵌入圖,建立了n個(gè)分支來(lái)進(jìn)行嵌入操作,對(duì)于第g個(gè)全連接圖的鄰接矩陣各層的計(jì)算定義如下:
在偏差取決于注意力相關(guān)的鄰接矩陣的情況下,權(quán)重矩陣根據(jù)g來(lái)決定,且g={1,...,n},為基于第g個(gè)全連接圖第l層學(xué)習(xí)的權(quán)重矩陣,為基于第g個(gè)全連接圖第l層學(xué)習(xí)的偏置向量,為基于第g個(gè)全連接圖第l層輸出的第i個(gè)節(jié)點(diǎn)特征,為基于第g個(gè)全連接圖第1層輸出的第i個(gè)節(jié)點(diǎn)特征為原始節(jié)點(diǎn)特征經(jīng)過(guò)圖卷積后得到;
將最大池化操作應(yīng)用于融合多個(gè)更新后的節(jié)點(diǎn)特征的信息以獲得每個(gè)更新后的節(jié)點(diǎn)的唯一特征,獲得每個(gè)更新后的節(jié)點(diǎn)最終的用于分類(lèi)的特征。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110056309.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:云安全產(chǎn)品用戶(hù)管理方法、裝置、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 下一篇:基于多波長(zhǎng)效應(yīng)下的薄膜元件時(shí)域動(dòng)態(tài)電場(chǎng)仿真方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類(lèi)方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門(mén)機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





