[發明專利]情感識別方法、裝置、電子設備及存儲介質在審
| 申請號: | 202111493400.7 | 申請日: | 2021-12-08 |
| 公開(公告)號: | CN114373455A | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 李良斌;陳孝良 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L25/63;G06N3/04;G06N3/08 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 唐博 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 情感 識別 方法 裝置 電子設備 存儲 介質 | ||
本申請涉及一種情感識別方法、裝置、電子設備及存儲介質,應用于語音處理技術領域,所述方法包括:獲取待識別的語音數據,基于預先訓練完成的情感識別模型中的目標語音特征提取網絡,從語音數據中提取語音特征信息;基于情感識別模型中的目標文本特征提取網絡,從語音數據對應的文本信息中提取文本特征信息;基于情感識別模型中的第一目標輸出網絡對語音特征信息和文本特征信息進行處理,得到第一情感類別輸出結果;基于情感識別模型中的第二目標輸出網絡對文本特征信息進行處理,得到第二情感類別輸出結果;根據第一情感類別輸出結果和第二情感類別輸出結果,確定語音數據所屬的情感類別。本申請可以提高情感識別的準確性。
技術領域
本申請涉及語音處理技術領域,尤其涉及一種情感識別方法、裝置、電子設備及存儲介質。
背景技術
在智能語音對話系統中,情感分析技術具有重要的應用價值。例如,在客服及外呼場景中,通過分析用戶語音所表達的情感,可以針對性地對回復話術進行優化,以提升用戶體驗。
相關技術中,可以基于NLP(Natural Language Processing,自然語言處理)技術,通過對語音數據對應文本進行分類,確定語音數據的情感類別。然而,由于所使用的信息量單一,因此該方法所識別的情感類別準確性較低。
發明內容
為了解決上述技術問題,本申請提供了一種情感識別方法、裝置、電子設備及存儲介質。
根據本申請的第一方面,提供了一種情感識別方法,包括:
獲取待識別的語音數據,基于預先訓練完成的情感識別模型中的目標語音特征提取網絡,從所述語音數據中提取語音特征信息;
基于所述情感識別模型中的目標文本特征提取網絡,從所述語音數據對應的文本信息中提取文本特征信息;
基于所述情感識別模型中的第一目標輸出網絡對所述語音特征信息和所述文本特征信息進行處理,得到第一情感類別輸出結果;
基于所述情感識別模型中的第二目標輸出網絡對所述文本特征信息進行處理,得到第二情感類別輸出結果;
根據第一情感類別輸出結果和所述第二情感類別輸出結果,確定所述語音數據所屬的情感類別。
可選的,所述情感識別模型的訓練方法包括:
獲取訓練數據,其中,所述訓練數據包括:多個樣本語音數據、所述樣本語音數據對應的第一情感類別以及所述樣本語音數據對應的樣本文本信息的第二情感類別;
基于初始語音特征提取網絡從所述樣本語音數據中提取樣本語音特征信息,基于初始文本特征提取網絡從所述樣本文本信息中提取樣本文本特征信息;
基于第一初始輸出網絡對所述樣本語音特征信息和所述樣本文本特征信息進行處理,得到第一情感類別預測結果;
根據所述第一情感類別預測結果和所述第一情感類別對應的第一標簽數據,得到第一損失函數值;
基于第二初始輸出網絡對所述樣本文本特征信息進行處理,得到第二情感類別預測結果;
根據所述第二情感類別預測結果和所述第二情感類別對應的第二標簽數據,得到第二損失函數值;
根據所述第一損失函數值和所述第二損失函數值,分別對所述初始語音特征提取網絡的網絡參數、所述初始文本特征提取網絡的網絡參數、所述第一初始輸出網絡的網絡參數和所述第二初始輸出網絡的網絡參數進行調整,得到所述情感識別模型。
可選的,所述方法還包括:
如果內容相同的多個所述樣本文本信息存在多種第二情感類別,根據所述訓練數據中多種所述第二情感類別分別對應的內容相同的所述樣本文本信息的比例,確定內容相同的所述樣本文本信息分別對應的第二情感類別的第二標簽數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111493400.7/2.html,轉載請聲明來源鉆瓜專利網。





