[發(fā)明專利]一種面向機(jī)器人的多模態(tài)融合情感計(jì)算方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201810813473.1 | 申請(qǐng)日: | 2018-07-23 |
| 公開(公告)號(hào): | CN108960191B | 公開(公告)日: | 2021-12-14 |
| 發(fā)明(設(shè)計(jì))人: | 佘瑩瑩;陳錦;舒楊 | 申請(qǐng)(專利權(quán))人: | 廈門大學(xué) |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/62 |
| 代理公司: | 泉州市文華專利代理有限公司 35205 | 代理人: | 陳雪瑩 |
| 地址: | 361000 福建*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 機(jī)器人 多模態(tài) 融合 情感 計(jì)算方法 系統(tǒng) | ||
1.一種面向機(jī)器人的多模態(tài)融合情感計(jì)算方法,其特征在于:包括如下步驟:
步驟1、獲取得到多模態(tài)信息,通過(guò)實(shí)時(shí)捕捉與機(jī)器人交互的人的語(yǔ)言信息以及非語(yǔ)言信息,包括面部表情、頭眼關(guān)注、手勢(shì)和文本;
步驟2、構(gòu)建不同信息的處理通道進(jìn)行特征分類與識(shí)別,包括語(yǔ)言信息和非語(yǔ)言信息的特征分類與識(shí)別;
步驟3、對(duì)多模態(tài)信息進(jìn)行處理,通過(guò)PAD模型與OCC模型將信息映射到PAD三維空間上;
步驟4、對(duì)各個(gè)模態(tài)信息在決策層融合時(shí)進(jìn)行時(shí)序?qū)R,進(jìn)行基于時(shí)序的情感維度空間的計(jì)算。
2.根據(jù)權(quán)利要求1所述的一種面向機(jī)器人的多模態(tài)融合情感計(jì)算方法,其特征在于:所述步驟2進(jìn)一步包括:
針對(duì)非語(yǔ)言信息,完成對(duì)面部表情、頭眼部關(guān)注以及興趣物的識(shí)別、身體姿勢(shì)以及手勢(shì)的識(shí)別;
針對(duì)語(yǔ)言信息,完成自然語(yǔ)言處理,并輸出對(duì)應(yīng)的句子成分與語(yǔ)音特征。
3.根據(jù)權(quán)利要求1所述的一種面向機(jī)器人的多模態(tài)融合情感計(jì)算方法,其特征在于:所述步驟4進(jìn)一步包括:
步驟41、對(duì)非語(yǔ)言信息,使用線性回歸模型來(lái)對(duì)獲取的9個(gè)PAD參數(shù)值進(jìn)行不同時(shí)間不同模態(tài)的融合預(yù)測(cè),使用線性回歸器進(jìn)行融合:
Pn=μ1·P1+μ2·P2+μ3·P3 公式1
An=θ1·A1+θ2·A2+θ3·A3 公式2
Dn=σ1·D1+σ2·D2+σ3·D3 公式3
其中P1,P2,P3;A1,A2,A3;D1,D2,D3分別為面部、手勢(shì)、眼部關(guān)注度三個(gè)模塊的PAD參數(shù)值,Pn,An,Dn為融合后非語(yǔ)言部分的PAD參數(shù)值;μ1,μ2,μ3分別為愉悅度線性方程中的常量,θ1,θ2,θ3分別為激活度線性方程中的常量,σ1,σ2,σ3分別為控制度線性方程中的常量;
步驟42、使用一次線性回歸模型,將非語(yǔ)言信息和語(yǔ)言信息進(jìn)行最終的融合,公式如下:
P融合=μ4·P非語(yǔ)言+μ5·P語(yǔ)言 公式4
A融合=θ4·A非語(yǔ)言+θ5·A語(yǔ)言 公式5
D融合=σ4·D非語(yǔ)言+σ5·D語(yǔ)言 公式6
其中,P融合、A融合和D融合分別為最終融合后的PAD參數(shù)值,μ4,μ5分別為愉悅度線性方程中的常量,θ4,θ5分別為激活度線性方程中的常量,σ4,σ5分別為控制度線性方程中的常量;根據(jù)融合得到的語(yǔ)言與非語(yǔ)言部分的PAD值,進(jìn)行最終的融合,得到最終的PAD參數(shù)值。
4.一種面向機(jī)器人的多模態(tài)融合情感計(jì)算系統(tǒng),其特征在于:包括:
信息獲取模塊,用于獲取得到多模態(tài)信息,通過(guò)實(shí)時(shí)捕捉與機(jī)器人交互的人的語(yǔ)言信息以及非語(yǔ)言信息,包括面部表情、頭眼關(guān)注、手勢(shì)和文本;
特征分類與識(shí)別模塊,用于構(gòu)建不同信息的處理通道進(jìn)行特征分類與識(shí)別,包括語(yǔ)言信息和非語(yǔ)言信息的特征分類與識(shí)別;
模型構(gòu)建模塊,用于對(duì)多模態(tài)信息進(jìn)行處理,通過(guò)PAD模型與OCC模型將信息映射到PAD三維空間上;以及
融合模塊,用于對(duì)各個(gè)模態(tài)信息在決策層融合時(shí)進(jìn)行時(shí)序?qū)R,進(jìn)行基于時(shí)序的情感維度空間的計(jì)算。
5.根據(jù)權(quán)利要求4所述的一種面向機(jī)器人的多模態(tài)融合情感計(jì)算系統(tǒng),其特征在于:所述特征分類與識(shí)別模塊進(jìn)一步包括:
針對(duì)非語(yǔ)言信息,完成對(duì)面部表情、頭眼部關(guān)注以及興趣物的識(shí)別、身體姿勢(shì)以及手勢(shì)的識(shí)別;
針對(duì)語(yǔ)言信息,完成自然語(yǔ)言處理,并輸出對(duì)應(yīng)的句子成分與語(yǔ)音特征。
6.根據(jù)權(quán)利要求4所述的一種面向機(jī)器人的多模態(tài)融合情感計(jì)算系統(tǒng),其特征在于:所述融合模塊進(jìn)一步包括融合預(yù)測(cè)模塊和決策層融合模塊:
所述融合預(yù)測(cè)模塊,用于對(duì)非語(yǔ)言信息,使用線性回歸模型來(lái)對(duì)獲取的9個(gè)PAD參數(shù)值進(jìn)行不同時(shí)間不同模態(tài)的融合預(yù)測(cè),使用線性回歸器進(jìn)行融合:
Pn=μ1·P1+μ2·P2+μ3·P3 公式1
An=θ1·A1+θ2·A2+θ3·A3 公式2
Dn=σ1·D1+σ2·D2+σ3·D3 公式3
其中P1,P2,P3;A1,A2,A3;D1、D2,D3分別為面部、手勢(shì)、眼部關(guān)注度三個(gè)模塊的PAD參數(shù)值,Pn,An,Dn為融合后非語(yǔ)言部分的PAD參數(shù)值;μ1,μ2,μ3分別為愉悅度線性方程中的常量,θ1,θ2,θ3分別為激活度線性方程中的常量,σ1,σ2,σ3分別為控制度線性方程中的常量;
所述決策層融合模塊,用于使用一次線性回歸模型,將非語(yǔ)言信息和語(yǔ)言信息進(jìn)行最終的融合,公式如下:
P融合=μ4·P非語(yǔ)言+μ5·P語(yǔ)言 公式4
A融合=θ4·A非語(yǔ)言+θ5·A語(yǔ)言 公式5
D融合=σ4·D非語(yǔ)言+σ5·D語(yǔ)言 公式6
其中,P融合、A融合和D融合分別為最終融合后的PAD參數(shù)值,μ4,μ5分別為愉悅度線性方程中的常量,θ4,θ5分別為激活度線性方程中的常量,σ4,σ5分別為控制度線性方程中的常量;根據(jù)融合得到的語(yǔ)言與非語(yǔ)言部分的PAD值,進(jìn)行最終的融合,得到最終的PAD參數(shù)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門大學(xué),未經(jīng)廈門大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810813473.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于智能機(jī)器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識(shí)別方法及裝置
- 一種基于多模態(tài)生成式對(duì)抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識(shí)別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機(jī)制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法





