[發明專利]基于融合特征MGFCC的說話人二次特征提取方法在審
| 申請號: | 201710322792.8 | 申請日: | 2017-05-09 |
| 公開(公告)號: | CN107274887A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 張毅;王可佳;顏博;樂聰聰 | 申請(專利權)人: | 重慶郵電大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/20;G10L17/02;G10L19/02;G10L19/26;G10L25/24;G10L25/45;G06K9/00 |
| 代理公司: | 重慶市恒信知識產權代理有限公司50102 | 代理人: | 劉小紅,李金蓉 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 融合 特征 mgfcc 說話 二次 提取 方法 | ||
1.基于融合特征MGFCC的說話人二次特征提取方法,其特征在于,包括以下步驟:
S1:利用Mel濾波器對說話人語音信號進行處理得到MFCC特征;
S2:同時利用Gammatone濾波器對說話人語音信號進行處理得到GFCC特征;
S3:分別計算MFCC特征和GFCC特征在噪聲環境下的各維特征區分度FR;
S4:分別統計MFCC特征和GFCC特征的每一維特征處于最大特征區分度的次數;
S5:根據步驟S4統計的兩種特征在噪聲背景下的最大特征區分度次數進行特征融合;
S6:對步驟S5獲得的融合特征進行微分和特征重組得到二次提取特征。
2.根據權利要求1所述基于融合特征MGFCC的說話人二次特征提取方法,其特征在于:步驟S1所述MFCC特征提取的方法為:
S11:對說話人語音信號進行預加重處理:采用數字濾波器對說話人語音信號進行處理,其Z域中的傳遞函數為:H(z)=1-0.95z-1;
S12:對步驟S11處理后的信號進行分幀加窗,其中每一幀含有N個采樣點,窗函數為w(n),則加窗后的語音信號sw(n)為:
sw(n)=y(n)*w(n)
式中,y(n)為預加重之后的信號,0≤n≤N;
S13:快速傅里葉變換:將S12處理后的信號進行快速傅里葉變換,從時域數據變換到頻域,得到語音線性頻譜X(k)為:
S14:對每一幀快速傅里葉變換后的數據計算譜線能量:E(k)=[X(k)]2;
S15:對每個Mel濾波器的輸出作對數運算,可得對數頻譜S(m)為:
Hm(k)表示Mel濾波器的頻率響應,M表示Mel濾波器的個數;
S16:對對數頻譜S(m)進行離散余弦變換變換,進而得到特征MFCC,則第n維特征C(n)為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶郵電大學,未經重慶郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710322792.8/1.html,轉載請聲明來源鉆瓜專利網。





