[發明專利]一種基于多流分層融合變換特征和長短時記憶網絡的說話人辨識方法有效
| 申請號: | 201810493026.2 | 申請日: | 2018-05-22 |
| 公開(公告)號: | CN108694951B | 公開(公告)日: | 2020-05-22 |
| 發明(設計)人: | 李鵬乾;李艷雄 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L17/20 | 分類號: | G10L17/20;G10L17/18;G10L17/02;G10L17/04 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分層 融合 變換 特征 短時記憶 網絡 說話 辨識 方法 | ||
1.一種基于多流分層融合變換特征和長短時記憶網絡的說話人辨識方法,其特征在于,所述的說話人辨識方法包括下列步驟:
步驟S1、聲學特征提取:從語音樣本提取Filterbank特征和MFCC特征;
步驟S2、構建深度置信網絡特征提取器,構建三個帶瓶頸層的深度置信網絡提取融合變換特征;
步驟S3、融合變換特征提取:上述三個深度置信網絡的前兩個網絡分別對Filterbank特征和MFCC特征進行變換得到兩個瓶頸特征,第三個網絡對上述兩個瓶頸特征進行變換得到融合變換特征;
步驟S4、說話人辨識:將上述融合變換特征輸入長短時記憶網絡,判斷輸入語音樣本是哪個具體說話人的語音,所述的步驟S4包括:
步驟S4.1、構建長短時記憶網絡,過程如下:
步驟S4.1.1、更新循環神經網絡:對于循環神經網絡,語音數據序列的信息分為兩個方向輸入,分別保存兩個方向輸入數據的信息,并將相應的輸出連接到相同的輸出層,每個節點表示在每個時刻循環神經網絡的一層,第t時刻隱含層的輸出為:
h(t)=g(Uh(t-1)+Wx(t)+b),
其中,U表示循環神經網絡輸入層到隱含層的權值矩陣,W表示隱含層到輸出層的權值矩陣,x(t)為第t時刻的輸入,b為偏差,模型的迭代過程從t=1時刻開始,隨著t的增長,使用上式進行計算,其中,g為tanh激活函數:
步驟S4.1.2、迭代更新長短時記憶網絡記憶單元,訓練得到長短時記憶網絡;
步驟S4.2、以融合變換特征作為輸入,設置長短時記憶網絡softmax層,輸出說話人辨識結果。
2.根據權利要求1所述的一種基于多流分層融合變換特征和長短時記憶網絡的說話人辨識方法,其特征在于,所述的步驟S1包括:
步驟S1.1、預加重:以f(z)=1-αz-1為傳遞函數對輸入的語音進行濾波,其中α的取值范圍是[0.9,1];
步驟S1.2、分幀:預加重后,將語音切分成特定長度的語音幀,記幀長為L,幀移為S,第r幀語音表示為xr(n),其中1≤r≤R,0≤n≤N-1,R和N分別代表幀數和每幀語音的采樣點數;
步驟S1.3、加窗:將各幀語音與窗函數w(n)相乘,窗函數取漢明窗,記為:
步驟S1.4、提取Filterbank特征和MFCC特征。
3.根據權利要求2所述的一種基于多流分層融合變換特征和長短時記憶網絡的說話人辨識方法,其特征在于,所述的步驟S1.4包括:
步驟S1.4.1、對每幀語音做離散傅立葉變換,記第r幀語音的線性頻譜為Sr(k):
步驟S1.4.2、得到線性頻譜Sr(k)后,通過梅爾濾波器組濾波得到梅爾頻譜,再進行對數運算得到Filterbank特征Fbr(m),其中梅爾濾波器組為若干個帶通濾波器,記為Hm(k),0≤m≤M,其中M為濾波器的個數,每個濾波器具有三角形濾波特性,中心頻率為f(m),相鄰f(m)的間隔隨著m的增大逐漸變大,每個帶通濾波器的傳遞函數為:
其中,f(m)定義如下:
上式中,fl和fh分別表示濾波器頻率范圍的最低頻率和最高頻率,N表示每幀語音的采樣點數,fs表示采樣頻率,B-1為B的逆函數,記為:
B-1(b)=700(eb/1125-1),
因此,由線性譜Sr(k)到Filterbank特征的函數表達式為:
步驟S1.4.3、對上述Filterbank特征進行離散余弦變換,得到每幀語音的MFCC特征,其中第r幀語音的MFCC特征表達式為:
步驟S1.4.4、對每幀語音信號重復步驟S1.4.1-S1.4.4,得到所有語音幀的Filterbank特征和MFCC特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810493026.2/1.html,轉載請聲明來源鉆瓜專利網。





