[發明專利]帶噪語音情感識別方法、系統、設備及存儲介質有效
| 申請號: | 202110332451.5 | 申請日: | 2021-03-29 |
| 公開(公告)號: | CN113053417B | 公開(公告)日: | 2022-04-19 |
| 發明(設計)人: | 姜曉慶;陳貞翔;楊倩;鄭永強 | 申請(專利權)人: | 濟南大學;山東思正信息科技有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/87;G10L25/30 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250022 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 情感 識別 方法 系統 設備 存儲 介質 | ||
本發明公開了帶噪語音情感識別方法、系統、設備及存儲介質,獲取待識別的帶噪語音信號;對待識別的帶噪語音信號進行端點檢測處理;根據端點得到若干個有聲音的語音片段;對有聲音的語音片段進行特征提取,得到語音特征;將語音特征輸入到訓練后的語音情感識別模型中,輸出情感類別。端點檢測方法可以在樣本重建過程中,計算正交匹配追蹤算法算法迭代過程中預測殘差與上一次迭代的信號估計值之間的條件熵,根據迭代前后的殘差條件熵差值,在樣本重建完成的同時直接給出重建樣本的端點檢測結果,充分利用樣本重建過程中產生的數據,節省系統后續的分析與處理時間,且由于該端點檢測方法是建立在壓縮感知重建算法之上的,具有抗噪性能。
技術領域
本申請涉及語音情感識別技術領域,特別是涉及帶噪語音情感識別方法、系統、設備及存儲介質。
背景技術
本部分的陳述僅僅是提到了與本申請相關的背景技術,并不必然構成現有技術。
語音端點檢測方法在語音信號處理領域中有廣泛且重要的應用,對于減少處理的數據量、語音的有效特征學習、語音識別及語音情感識別的精確度等方面具有重要的研究意義。
無處不在噪聲的存在往往使語音端點檢測準確度下降,目前研究已表明壓縮感知(Compressed Sensing,CS)在語音信號的去噪方面也具有優越的性能。根據CS理論,語音信號在經適當的稀疏基與觀測矩陣變換后所獲得的觀測值中包含了語音信號中的全部有用信息,觀測值經傳輸后在接收端可采用一定的重建算法可重建語音信號,而噪聲無法實現稀疏性因而不可重建,所以壓縮感知在大大減少語音傳輸數據量的同時、在重建過程中同時也實現了去噪處理。同時,由于語音信號中的清音段具有類噪聲特性,在重建過程中會被抑制,使重建樣本的清濁劃分更為準確,有助于提高后續語音特征參數的提取精確度。現有研究也表明,壓縮感知理論下的重建語音樣本可以有效應用于帶噪語音情感識別。
在以往的研究中,人們關注的重點在于信號重建,忽視重建過程中產生的參數及數據的特性的研究與應用,造成數據資源的浪費。比如若對重建樣本需要進行語音樣本端點檢測,則需要在獲取重建樣本之后,然后對重建樣本采用某種端點檢測算法進行分析,無法實現重建的同時給出端點檢測結果,所以現有的端點檢測處理方法無疑會增加系統處理的時延。另外,現有的端點檢測算法均是基于語音信號本身進行處理,數據維度高,運算效率低。
發明內容
為了解決現有技術的不足,本申請提供了帶噪語音情感識別方法及系統;
第一方面,本申請提供了帶噪語音情感識別方法;
帶噪語音情感識別方法,包括:
獲取待識別的帶噪語音信號;
對待識別的帶噪語音信號進行端點檢測處理;根據端點得到若干個有聲音的語音片段;
對有聲音的語音片段進行特征提取,得到語音特征;
將語音特征輸入到訓練后的語音情感識別模型中,輸出情感類別。
第二方面,本申請提供了帶噪語音情感識別系統;
帶噪語音情感識別系統,包括:
獲取模塊,其被配置為:獲取待識別的帶噪語音信號;
端點檢測模塊,其被配置為:對待識別的帶噪語音信號進行端點檢測處理;根據端點得到若干個有聲音的語音片段;
特征提取模塊,其被配置為:對有聲音的語音片段進行特征提取,得到語音特征;
輸出模塊,其被配置為:將語音特征輸入到訓練后的語音情感識別模型中,輸出情感類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于濟南大學;山東思正信息科技有限公司,未經濟南大學;山東思正信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110332451.5/2.html,轉載請聲明來源鉆瓜專利網。





