[發(fā)明專利]一種基于情感體系的人機交互方法、裝置和交互系統(tǒng)在審
申請?zhí)枺?/td> | 201610040503.0 | 申請日: | 2016-01-21 |
公開(公告)號: | CN105739688A | 公開(公告)日: | 2016-07-06 |
發(fā)明(設計)人: | 劉佳亮 | 申請(專利權)人: | 北京光年無限科技有限公司 |
主分類號: | G06F3/01 | 分類號: | G06F3/01 |
代理公司: | 北京聿宏知識產(chǎn)權代理有限公司 11372 | 代理人: | 朱繪;李心穩(wěn) |
地址: | 100000 北京市石景山區(qū)石景山*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 基于 情感 體系 人機交互 方法 裝置 交互 系統(tǒng) | ||
技術領域
本發(fā)明涉及智能服務技術領域,具體地說,涉及一種基于情感體系的人機交互方法、裝置和交互系統(tǒng)。
背景技術
智能問答機器人屬于人工智能和自然語言處理的交叉領域,可以通過自然語言的方式與用戶交流,并通過表情、動作等方式展示機器人的情感。情感是人對客觀事物是否滿足自己的需要而產(chǎn)生的體驗態(tài)度,是人機對話過程中傳遞的重要信息。人機交互過程中,情感識別是交互系統(tǒng)的重要部分。情感狀態(tài)影響著信息表達的方式和信息傳遞的效果。
情感表達的模態(tài)包括言語、文字、面部表情和肢體動作等等。其中,面部表情通過采集人臉圖像獲得,語言情感從帶有情感的語音信號中提取,肢體動作較直接地表達了人們的情感。有研究認為,在人機交互過程中面部表情的作用最大,其對情感表達的貢獻超過五成;語言表達情感的作用次之,貢獻大概不到四成。
現(xiàn)有的情感識別技術通常是單一模態(tài)的表情情感識別或者語音情感識別,不能對多種模態(tài)識別到的情感進行融合處理。因此,問答機器人不能同時識別用戶輸入的語音、表情和肢體動作,不能準確辨識用戶情感。
因此,亟需一種能夠在問答過程中同時識別多種模態(tài)情感特征,并進行反饋的人機交互方法和裝置。
發(fā)明內(nèi)容
本發(fā)明的目的之一在于解決現(xiàn)有的人機問答系統(tǒng)不能同時識別用戶輸入的語音、表情和肢體動作中的情感特征的技術缺陷。
本發(fā)明的實施例首先提供
一種基于情感體系的人機交互方法,包括以下步驟:
采集語音情感參數(shù)、表情情感參數(shù)和肢體情感參數(shù);
根據(jù)所述語音情感參數(shù)計算獲得待定語音情感,從預設語音情感中選擇與待定語音情感最接近的作為語音情感分量;
根據(jù)所述表情情感參數(shù)計算獲得待定表情情感,從預設表情情感中選擇與待定表情情感最接近的作為表情情感分量;
根據(jù)所述肢體情感參數(shù)計算獲得待定肢體情感,從預設肢體情感中選擇與待定肢體情感最接近的作為肢體情感分量;
對所述語音情感分量、表情情感分量和肢體情感分量進行融合確定情感識別結果;
針對所述情感識別結果輸出多模態(tài)的反饋信息。
優(yōu)選地,在從預設語音情感中選擇與待定語音情感最接近的作為語音情感分量的步驟中包括:
采用PCA方法對語音樣本進行建模獲得投影矩陣,以該投影矩陣為基礎,從預設語音情感中選擇與待定語音情感最接近的作為語音情感分量。
優(yōu)選地,在從預設表情情感中選擇與待定表情情感最接近的作為表情情感分量的步驟中包括:
將預設表情情感映射到特征臉空間,在特征臉空間中計算待定表情情感與預設表情情感之間的距離,選擇距離最小的預設表情情感作為表情情感分量。
優(yōu)選地,在所述對所述語音情感分量、表情情感分量和肢體情感分量進行融合確定情感識別結果的步驟中包括:
對所述語音情感分量、表情情感分量和肢體情感分量分別賦予權重,依據(jù)權重對所述語音情感分量、表情情感分量和肢體情感分量進行加權處理確定所述情感識別結果。
優(yōu)選地,在針對所述情感識別結果輸出多模態(tài)的反饋信息的步驟中包括:
根據(jù)所述情感識別結果在語音反饋信息、表情反饋信息和肢體反饋信息中選擇至少一種進行輸出。
一種基于情感體系的人機交互裝置,包括:
參數(shù)采集單元,其配置為采集語音情感參數(shù)、表情情感參數(shù)和肢體情感參數(shù);
語音情感識別單元,其配置為根據(jù)所述語音情感參數(shù)計算獲得待定語音情感,從預設語音情感中選擇與待定語音情感最接近的作為語音情感分量;
表情情感識別單元,其配置為根據(jù)所述表情情感參數(shù)計算獲得待定表情情感,從預設表情情感中選擇與待定表情情感最接近的作為表情情感分量;
肢體情感識別單元,其配置為根據(jù)所述肢體情感參數(shù)計算獲得待定肢體情感,從預設肢體情感中選擇與待定肢體情感最接近的作為肢體情感分量;
融合單元,其配置為對所述語音情感分量、表情情感分量和肢體情感分量進行融合確定情感識別結果;
反饋單元,其配置為針對所述情感識別結果輸出多模態(tài)的反饋信息。
優(yōu)選地,所述語音情感處理單元具體用于:
采用PCA方法對語音樣本進行建模獲得投影矩陣,以該投影矩陣為基礎,從預設語音情感中選擇與待定語音情感最接近的作為語音情感分量。
優(yōu)選地,所述表情情感處理單元具體用于:
將預設表情情感映射到特征臉空間,在特征臉空間中計算待定表情情感與預設表情情感之間的距離,選擇距離最小的預設表情情感作為表情情感分量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京光年無限科技有限公司,未經(jīng)北京光年無限科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610040503.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉變成為計算機能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機傳送到輸出設備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計算機之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出