[發明專利]基于高斯混合模型的聲紋識別方法及系統無效
| 申請號: | 201110267690.3 | 申請日: | 2011-09-12 |
| 公開(公告)號: | CN102324232A | 公開(公告)日: | 2012-01-18 |
| 發明(設計)人: | 霍春寶;張健;趙立輝;劉春玲;張彩娟 | 申請(專利權)人: | 遼寧工業大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06 |
| 代理公司: | 錦州遼西專利事務所 21225 | 代理人: | 李輝 |
| 地址: | 121000 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 混合 模型 聲紋 識別 方法 系統 | ||
1.一種基于高斯混合模型的聲紋識別方法,其特征是具體步驟如下:
(1)、語音信號的采集:以程控交換綜合實驗箱的話機作為采集語音信號的終端設備,通過語音卡采集語音信號;
(2)、語音信號的預處理:通過計算機將提取的語音信號進行分幀加窗操作,在分幀過程中一幀包括256個采樣點,幀移為128個采樣點,所加的窗函數為漢明窗;端點檢測,采用基于短時能量和短時過零率法相結合的端點檢測法;預加重,加重系數的范圍為0.90~1.00;
(3)、語音信號特征參數提取:采用梅爾頻率倒譜系數(MFCC),MFCC的階數通常取為12~16;
(4)、模型訓練:采用EM算法為說話人的語音信號特征參數訓練高斯混合模型(GMM),模型的參數初始化方法選用k-means算法;
(5)、聲紋辨識:通過將采集到的待識別語音信號特征參數與庫中通過第1步驟1、第2步驟、第3步驟已建立的說話人語音模型進行比較,并根據最大后驗概法進行判斷,若對應的說話人模型使得待識別的話者語音特征向量X具有最大的后驗概率,則認為識別出說話人。
2.根據權利要求1所述的基于高斯混合模型的聲紋識別方法,其特征是語音信號特征參數提取步驟如下:
(1)?將預處理后的語音信號進行短時傅里葉變換(DFT)得到其頻譜X(k),語音信號的DFT公式為:?
???????????????????????(1)
其中,為輸入的以幀為單位的語音信號,N為傅里葉變換的點數,取256;
(2)求頻譜的平方,即能量譜,然后通過Mel頻率濾波器對語音信號的頻譜進行平滑,并消除諧波,凸顯原先語音的共振峰;
Mel頻率濾波器是一組三角帶通濾波器,中心頻率為,=1,2,…,Q,?Q為三角帶通濾波器的個數,Mel濾波器表示如下:
??????????(2)
(3)對濾波器組輸出的Mel頻譜取對數:壓縮語音頻譜的動態范圍;將頻域中噪聲的乘性成分轉換成加性成分,對數Mel頻譜如下:
????????????????????????(3)
(4)離散余弦變換(DCT)
將第3步驟獲得的對數Mel頻譜變換到時域,其結果為Mel頻率倒譜系數(MFCC),第n個系數的計算如下式:
??????????????(4)
?其中,L為MFCC參數的階數,Q為Mel濾波器的個數,L通常取12~16,Q取23~26,本發明依據實驗情況取L=13,Q=25。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于遼寧工業大學,未經遼寧工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110267690.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內端面銑床
- 下一篇:鉛酸電池的鉛粒鑄造機





