[發明專利]一種基于情感GMM模型權重合成的情感說話人識別方法有效
| 申請號: | 201310394533.8 | 申請日: | 2013-09-02 |
| 公開(公告)號: | CN103456302A | 公開(公告)日: | 2013-12-18 |
| 發明(設計)人: | 楊瑩春;陳力;吳朝暉 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L17/02;G10L17/04 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 情感 gmm 模型 權重 合成 說話 識別 方法 | ||
1.一種基于情感GMM模型權重合成的情感說話人識別方法,其特征在于,步驟如下:
(1)針對每個說話人,建立說話人的中性GMM模型,并依據對應的中性情感權重參數變換模型,得到不同的情感GMM模型;
(2)采集待識別說話人的語音并提取語音特征,將得到的語音特征在步驟(1)中得到的所有情感GMM模型中進行得分計算;
(3)將所有得分進行比較,得分最高的情感GMM模型所對應的說話人即為待識別說話人。
2.如權利要求1所述的基于情感GMM模型權重合成的情感說話人識別方法,其特征在于,所述中性情感權重參數變換模型利用徑向基神經網絡或者稀疏表達建立。
3.如權利要求2所述的基于情感GMM模型權重合成的情感說話人識別方法,其特征在于,所述中性情感權重參數變換模型的建立過程,具體包括以下步驟:
1-1、在開發庫中,提取所有情感狀態下的不同說話人的短時語音特征,通過EM算法訓練出情感無關的高斯混合背景模型;
1-2、利用該高斯混合背景模型,通過自適應均值和自適應權重,得到開發庫中每個說話人的中性GMM模型;
1-3、利用步驟1-2的中性GMM模型,通過自適應權重的方法,得到各種情感狀態下的情感GMM模型;
1-4、利用步驟1-2的中性GMM模型中的權重和步驟1-3的情感GMM模型中的權重,訓練徑向基神經網絡或者稀疏表達模型,得到中性情感權重參數變換模型。
4.如權利要求3所述的基于情感GMM模型權重合成的情感說話人識別方法,其特征在于,采用徑向基神經網絡得到中性情感權重參數變換模型時,具體包括以下步驟:在開發庫中,利用每個說話人的中性GMM模型權重序列以及該說話人對應的每種情感GMM模型權重序列,通過正交最小二乘法訓練得到GMM模型權重序列與每種情感GMM模型權重序列之間的映射關系,即中性情感權重參數變換模型。
5.如權利要求3所述的基于情感GMM模型權重合成的情感說話人識別方法,其特征在于,采用稀疏表達得到中性情感權重參數變換模型時,具體包括以下步驟:在開發庫中,利用每個說話人的中性GMM模型權重序列以及該說話人對應的每種情感GMM模型權重序列,得到中性情感對齊字典,即中性情感權重參數變換模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310394533.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語音控制的方法和智能空調系統
- 下一篇:一種LED可變信息標志的加工方法





