[發明專利]基于矢量量化和高斯混合模型的說話人識別系統在審
| 申請號: | 201710003175.1 | 申請日: | 2017-01-03 |
| 公開(公告)號: | CN108269573A | 公開(公告)日: | 2018-07-10 |
| 發明(設計)人: | 楊育斌;沈金偉;柯宗貴 | 申請(專利權)人: | 藍盾信息安全技術有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 510665 廣東省廣州市廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 高斯混合模型 矢量量化 說話人識別系統 倒譜系數 混合模型 梅爾頻率 信息特征 | ||
1.基于矢量量化和高斯混合模型的說話人識別系統,包括:訓練階段和識別階段,其中:
a1:訓練階段:每一個說話人說出一段文字材料后獲得的語音信號(定義為訓練樣本),對每一個訓練樣本建立匹配模型,每一個說話者對應一個模型;
a2:識別階段:從待識人的語音數據(定義為測試樣本)提取特征值,提取特征值中的參數與每一個匹配模型中的參數進行比較,通過每一個匹配模型計算得出待識別人的概率值,若某模型計算得的概率值最高并且該概率值高于給定閾值,則標簽待識人為該模型的說話者。
2.根據權利要求1所述的基于矢量量化和高斯混合模型的說話人識別系統,其特征在于,對原始數據預處理,錄音收集到說話人的原始語音數據后,需要經過預處理。預處理包括斷點檢測、預加重、分幀、加窗;通過GMM和VQ模型建模。
3.根據權利要求1所述的基于矢量量化和高斯混合模型的說話人識別系統,其特征在于,特征值提取,本方案選取MFCC作為特征向量。將預處理后的語音經過快速傅里葉變換后由時域信號變為頻域信號,然后取平方值、經過三角形濾波器組后取對數、再經過DCT變換,得到MFCC。
4.根據權利要求1所述的基于矢量量化和高斯混合模型的說話人識別系統,其特征在于,通過匹配模型GMM和VQ建模。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于藍盾信息安全技術有限公司,未經藍盾信息安全技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710003175.1/1.html,轉載請聲明來源鉆瓜專利網。





