[發明專利]一種基于對數譜平滑濾波的特征提取方法在審
| 申請號: | 202011095527.9 | 申請日: | 2020-10-14 |
| 公開(公告)號: | CN112233658A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 呂勇 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L21/0224;G10L21/0232 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 王恒靜 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 對數 平滑 濾波 特征 提取 方法 | ||
1.一種基于對數譜平滑濾波的特征提取方法,其特征在于,包括以下步驟:
(1)對輸入語音進行聲學預處理;
(2)對每一幀語音進行FFT運算,并取頻譜幅度,得到每幀信號的線性譜;
(3)對每幀信號的線性譜取對數,得到每幀信號的對數譜;
(4)對每幀信號的對數譜進行低通平滑濾波,得到每幀信號平滑后的對數譜;
(5)對每幀信號平滑后的對數譜取指數,得到每幀信號平滑后的線性譜;
(6)對每幀信號平滑后的線性譜進行Mel濾波,并取對數,得到每幀信號的Mel對數譜;
(7)對每幀信號的Mel對數譜進行離散余弦變換,并作一階差分和二階差分,得到輸入語音的特征參數。
2.如權利要求1所述的基于對數譜平滑濾波的特征提取方法,其特征在于,所述步驟(1)包括對輸入語音加窗,分幀,將其分解為幀信號,窗函數采用海明窗,幀移長度為幀長的一半。
3.如權利要求1所述的基于對數譜平滑濾波的特征提取方法,其特征在于,所述步驟(2)包括對預處理后的每一幀信號x(n),用快速傅里葉變換進行短時譜估計:
其中,N表示幀長,X(k)是x(n)的短時譜;
然后對短時譜X(k)取模,得到每幀信號的線性譜|X(k)|:
|X(k)|=X(k)。
4.如權利要求1所述的基于對數譜平滑濾波的特征提取方法,其特征在于,所述步驟(6)中,包括:
對每幀信號平滑后的線性譜采用Mel濾波器組對每幀信號的幅度譜進行加權求和,得到每幀信號的Mel譜S(m):
其中,Wm(k)為Mel濾波器組第m個三角濾波器在頻率k處的加權因子;M為濾波器的個數;S(m)為第m個濾波器的輸出,即Mel譜向量的第m個元素。
然后對S(m)取對數,得到Mel對數譜Slog(m):
Slog(m)=lnS(m)。
5.如權利要求1所述的基于對數譜平滑濾波的特征提取方法,其特征在于,所述步驟(7)包括:
因為對數譜特征Slog(m)的維數M較高,且各維系數的相關性較強,不利于聲學解碼,所以對每幀信號的Mel對數譜進行離散余弦變換,去除各維系數之間的相關性:
其中,L是靜態特征向量c的維數,c(l)是c的第l個元素。
6.如權利要求5所述的基于對數譜平滑濾波的特征提取方法,其特征在于,只保留靜態特征的低13維系數,即L=13。
7.如權利要求6所述的基于對數譜平滑濾波的特征提取方法,其特征在于,所述步驟(7)還包括:
對第t幀13維靜態特征向量ct作一階差分和二階差分,得到一階動態特征參數Δct和二階動態特征參數ΔΔct:
得到動態倒譜參數后,靜態參數ct和動態參數Δct、ΔΔct共同組成第t幀語音的39維倒譜特征向量
其中,上標T表示向量的轉置,即將列向量轉置為行向量,或者將行向量轉置為列向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011095527.9/1.html,轉載請聲明來源鉆瓜專利網。





