[發(fā)明專利]基于矢量量化的聲紋識別方法及系統(tǒng)無效
| 申請?zhí)枺?/td> | 201110450364.6 | 申請日: | 2011-12-29 |
| 公開(公告)號: | CN102509547A | 公開(公告)日: | 2012-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 霍春寶;趙立輝;崔文翀;張彩娟;曹景勝 | 申請(專利權(quán))人: | 遼寧工業(yè)大學(xué) |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02;G10L17/00 |
| 代理公司: | 錦州遼西專利事務(wù)所 21225 | 代理人: | 李輝 |
| 地址: | 121000 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 矢量 量化 聲紋 識別 方法 系統(tǒng) | ||
1.一種基于矢量量化的聲紋識別方法,其特征是,具體步驟如下:
(1)、語音信號的采集:以程控交換綜合實(shí)驗(yàn)箱的話機(jī)作為采集語音的終端設(shè)備,通過語音卡采集語音信號;
(2)、語音信號預(yù)處理:通過計(jì)算機(jī)將提取的語音信號進(jìn)行分幀加窗操作,在分幀過程中一幀包括256個采樣點(diǎn),幀移為128個采樣點(diǎn),所加的窗函數(shù)為漢明窗;端點(diǎn)檢測,采用基于短時能量和短時過零率相結(jié)合的端點(diǎn)檢測法;預(yù)加重,加重系數(shù)的取值為0.90~1.00;
(3)、語音信號特征參數(shù)提取:采用MFCC參數(shù),MFCC的階數(shù)為12~16;
(4)、模板訓(xùn)練:采用LBG聚類算法為系統(tǒng)中的每一個說話人建立一個碼本存儲在語音數(shù)據(jù)庫中作為該說話人的語音模板;
(5)、聲紋辨識:通過將采集到的待識別語音信號特征參數(shù)與庫中通過第1步~第4步已建立的說話人語音模板進(jìn)行比較,并根據(jù)加權(quán)歐式距離測度進(jìn)行判斷,若對應(yīng)的說話人模板使得待識別的話者語音特征向量X具有最小平均距離測度,則認(rèn)為識別出說話人。
2.根據(jù)權(quán)利要求1所述的基于矢量量化的聲紋識別方法,其特征是,語音信號特征參數(shù)提取步驟如下:
(1)將預(yù)處理后的語音信號進(jìn)行短時傅里葉變換得到其頻譜X(k),語音信號的DFT公式為:?
????????????????????????(1)
其中,為輸入的以幀為單位的語音信號,N為傅里葉變換的點(diǎn)數(shù),取256;
(2)求頻譜的平方,即能量譜,然后通過Mel頻率濾波器對語音信號的頻譜進(jìn)行平滑,并消除諧波,凸顯原先語音的共振峰;
Mel頻率濾波器是一組三角帶通濾波器,中心頻率為,=1,2,…,Q,?Q為三角帶通濾波器的個數(shù),Mel濾波器表示如下:
??????????(2)
(3)對濾波器組輸出的Mel頻譜取對數(shù):壓縮語音譜的動態(tài)范圍;將頻域中噪聲的乘性成分轉(zhuǎn)換成加性成分,對數(shù)Mel頻譜如下:
???????????????????????????(3)
(4)離散余弦變換(DCT)
將公式(3)獲得的對數(shù)Mel頻譜變換到時域,其結(jié)果為Mel頻率倒譜系數(shù)(MFCC),第n個系數(shù)的計(jì)算如下式:
????????????????????(4)
??其中,L為MFCC參數(shù)的階數(shù),Q為Mel濾波器的個數(shù),L取12~16,Q取23~26。
3.根據(jù)權(quán)利要求1所述的基于矢量量化的聲紋識別方法,其特征是,模板訓(xùn)練時所采用LBG聚類算法的具體步驟如下:
(1)取得輸入的特征矢量集合S中全體訓(xùn)練矢量X,并通過分裂碼本法給定一個初始碼本的碼字;?
(2)利用一個較小的閾值,,將一分為二,分裂的方法遵循下列規(guī)則:
?????????????????????????????????????????(5)
分裂后,得到新碼本的碼字,;
(3)根據(jù)最鄰近準(zhǔn)則,為新碼本的碼字尋找距離最近的碼字,最后把S分成m個子集,即當(dāng)時,
???????????????(6)
式中,M為當(dāng)前初始碼本中碼字的個數(shù);
(4)計(jì)算每個子集中特征矢量的質(zhì)心,并用這個質(zhì)心代替該集合中的碼字,這樣就得到了新的碼本;
(5)通過第3步、第4步進(jìn)行的迭代計(jì)算,得到新的碼本的碼字,;
(6)然后再重復(fù)第2步,將新得到的碼字各分為二,接著再通過第3步、第4步進(jìn)行迭代計(jì)算,如此繼續(xù),直到所需的碼本碼字?jǐn)?shù)是,r是整數(shù),則共需要做r輪上述的循環(huán)處理,直到聚類完畢,此時,各類的質(zhì)心即為所需的碼字。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于遼寧工業(yè)大學(xué),未經(jīng)遼寧工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110450364.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





