[發(fā)明專利]基于語音數(shù)據(jù)的情緒識別方法、裝置及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110575150.5 | 申請日: | 2021-05-26 |
| 公開(公告)號: | CN113314150A | 公開(公告)日: | 2021-08-27 |
| 發(fā)明(設(shè)計)人: | 鄧真 | 申請(專利權(quán))人: | 平安普惠企業(yè)管理有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/51;G10L15/22;G10L15/26;G10L25/27;G10L25/30 |
| 代理公司: | 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 語音 數(shù)據(jù) 情緒 識別 方法 裝置 存儲 介質(zhì) | ||
本申請實施例屬于人工智能技術(shù)領(lǐng)域,涉及一種基于語音數(shù)據(jù)的情緒識別方法,用于提高情緒識別的準(zhǔn)確率,該方法包括:獲取用戶的語音數(shù)據(jù);將所述語音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);采用預(yù)設(shè)的語音情緒模型對所述語音數(shù)據(jù)進(jìn)行情緒識別,輸出語音情緒標(biāo)簽,所述語音情緒模型為包括極端梯度提升Xgboost模型和長短期記憶網(wǎng)絡(luò)LSTM模型的組合模型;采用預(yù)設(shè)的文本情緒模型對所述文本數(shù)據(jù)進(jìn)行情緒識別,輸出文本情緒標(biāo)簽;根據(jù)所述語音情緒標(biāo)簽和所述文本情緒標(biāo)簽,確定綜合情緒標(biāo)簽。本申請還提供一種基于語音數(shù)據(jù)的情緒識別裝置、計算機設(shè)備及存儲介質(zhì)。此外,本申請還涉及區(qū)塊鏈技術(shù),用戶的語音數(shù)據(jù)可存儲于區(qū)塊鏈中。
技術(shù)領(lǐng)域
本申請涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種基于語音數(shù)據(jù)的情緒識別方法、裝置、計算機設(shè)備及存儲介質(zhì)。
背景技術(shù)
情緒識別是目前自然語言處理(natural language processing,NLP)技術(shù)中一個重要的研究方向,具體是指利用人工智能(artificial intelligence,AI)技術(shù),通過獲取個體的生理或非生理信號以對個體的情緒狀態(tài)進(jìn)行自動辨別,是情感計算的一個重要組成部分。情緒識別研究的內(nèi)容包括面部表情、語音、心率、行為、文本和生理信號識別等方面,通過以上內(nèi)容來判斷用戶的情緒狀態(tài)。其中,人的語音是能反應(yīng)人類情感的一個很重要的行為信號,比如語音中所包含的聲調(diào)、頻率波動或者語音對應(yīng)的文本內(nèi)容,均可以反映出一部分的人類情緒。
目前,基于語音信號的情緒識別技術(shù)在近幾年得到了廣泛的研究。但是由于針對用戶語音所進(jìn)行的情緒識別檢測維度較少,因此情緒識別的結(jié)果往往不夠準(zhǔn)確。
發(fā)明內(nèi)容
本申請實施例的目的在于提出一種基于語音數(shù)據(jù)的情緒識別方法、裝置、計算機設(shè)備及存儲介質(zhì),主要用于解決現(xiàn)有基于語音數(shù)據(jù)的情緒識別技術(shù)中,由于檢測維度少而帶來的精確度不夠的技術(shù)問題。
為了解決上述技術(shù)問題,本申請實施例提供一種基于語音數(shù)據(jù)的情緒識別方法,采用了如下所述的技術(shù)方案:
獲取用戶的語音數(shù)據(jù);
將該語音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);
采用預(yù)設(shè)的語音情緒模型對該語音數(shù)據(jù)進(jìn)行情緒識別,輸出語音情緒標(biāo)簽,該語音情緒模型為包括Xgboost模型和LSTM模型的組合模型;
采用預(yù)設(shè)的文本情緒模型對該文本數(shù)據(jù)進(jìn)行情緒識別,輸出文本情緒標(biāo)簽;
根據(jù)該語音情緒標(biāo)簽和該文本情緒標(biāo)簽,確定綜合情緒標(biāo)簽。
為了解決上述技術(shù)問題,本申請實施例還提供一種基于語音數(shù)據(jù)的情緒識別裝置,采用了如下所述的技術(shù)方案:
獲取單元,用于獲取用戶的語音數(shù)據(jù);
轉(zhuǎn)換單元,用于將該語音數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù);
第一情緒識別單元,用于采用預(yù)設(shè)的語音情緒模型對該語音數(shù)據(jù)進(jìn)行情緒識別,輸出語音情緒標(biāo)簽,該語音情緒模型為包括Xgboost模型和LSTM模型的組合模型;
第二情緒識別單元,用于采用預(yù)設(shè)的文本情緒模型對該文本數(shù)據(jù)進(jìn)行情緒識別,輸出文本情緒標(biāo)簽;
第三情緒識別單元,用于根據(jù)該語音情緒標(biāo)簽和該文本情緒標(biāo)簽,確定綜合情緒標(biāo)簽。
為了解決上述技術(shù)問題,本申請實施例還提供一種計算機設(shè)備,采用了如下所述的技術(shù)方案:
一種計算機設(shè)備,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)上所述基于語音數(shù)據(jù)的情緒識別方法的步驟。
為了解決上述技術(shù)問題,本申請實施例還提供一種計算機可讀存儲介質(zhì),采用了如下所述的技術(shù)方案:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安普惠企業(yè)管理有限公司,未經(jīng)平安普惠企業(yè)管理有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110575150.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





