[發明專利]基于語義細胞的語音情感識別方法有效
| 申請號: | 201410402937.1 | 申請日: | 2014-08-15 |
| 公開(公告)號: | CN104200814B | 公開(公告)日: | 2017-07-21 |
| 發明(設計)人: | 孫凌云;何博偉;湯永川;李彥;鄭楷洪 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L15/06 |
| 代理公司: | 杭州天勤知識產權代理有限公司33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 細胞 語音 情感 識別 方法 | ||
1.一種基于語義細胞的語音情感識別方法,其特征在于,包括:
(1)構建語音庫,所述語音庫中包括若干個語音參照人的若干條不同情感的語音信號;
(2)針對語音庫中任意一條語音信號,進行預處理將當前語音信號劃分為若干幀,并對每一幀進行情感特征提取,根據提取結果計算當前語音信號的特征向量;
(3)根據所述的特征向量,利用基于語義細胞的混合模型訓練得到分類器的識別模型;
(4)利用所述的識別模型識別待識別語音信號所屬的情感類別;
所述步驟(3)具體如下:
針對語音庫中的任意一個語音參照人,以當前語音參照人所有情感對應的簡化特征向量為訓練集,訓練得到基于語義細胞的混合模型,并作為用于識別該語音參照人的識別模型;
針對語音庫中的任意一個語音參照人的任意一種情感,以當前語音參照人當前情感對應的所有簡化特征向量為訓練集,訓練得到基于語義細胞的混合模型,并作為用于識別該語音參照人的相應情感的識別模型;
所述步驟(4)中識別過程如下:
(S1)通過步驟(2)得到待識別語音信號的特征向量,并利用降維變換矩陣對待識別語音信號的特征向量進行降維處理,得到相應的簡化特征向量;
(S2)針對各個語音參照人,根據用于識別當前語音參照人的識別模型,分別計算待識別語音信號對當前識別模型的隸屬度;
(S3)針對各個語音參照人的每一種情感,根據用于識別當前語音參照人的當前情感的識別模型,分別計算待識別語音信號對當前識別模型的隸屬度;
(S4)根據公式:
分別計算待識別語音對于各個語音參照人的每一種情感的綜合隸屬度,其中,為待識別語音對于第p個語音參考人的第e種情感的綜合隸屬度,μp為待識別語音對第p個語音參考人隸屬度,為待識別語音對第p個語音參考人情感e的隸屬度;
(S5)將所有對于相同情感的綜合隸屬度相加得到待識別語音對于該情感的隸屬度,并選擇隸屬度最大的情感作為待識別語音信號所屬的情感類別;
所述步驟(S1)和步驟(S2)中根據公式:
計算待識別語音信號X對當前識別模型的隸屬度,其中,Pr(Li)為第i個語義細胞Li對語義細胞混合模型貢獻程度,為待識別語音信號所對應的簡化特征向量與第i個語義細胞Li的隸屬度值,根據如下公式計算:
積分下限d(X,Pi)為X與第i個語義細胞的中心Pi的距離,ci,σi為當前識別模型中第i個語義細胞的位置參數和尺度參數;ε表示概念間距離,δ(ε|ci,σi)為位置參數、尺度參數分別為ci,σi的語義細胞Li的概率密度函數在概念距離ε上的概率密度值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410402937.1/1.html,轉載請聲明來源鉆瓜專利網。





