[發明專利]基于改進的Mel頻率尺度和相位修正的耳語音增強算法在審
| 申請號: | 201910146887.8 | 申請日: | 2019-02-27 |
| 公開(公告)號: | CN109712638A | 公開(公告)日: | 2019-05-03 |
| 發明(設計)人: | 李晨;韋怡;曾毓敏;李天峰 | 申請(專利權)人: | 南京師范大學 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0208 |
| 代理公司: | 北京盛凡智榮知識產權代理有限公司 11616 | 代理人: | 梁永昌 |
| 地址: | 210023 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 耳語音 算法 頻率尺度 噪聲估計 尺度 補償相位 相位修正 頻譜 改進 主觀聽力測試 共振峰頻率 客觀評價 聽覺模型 正常語音 相位譜 減去 合成 研究 | ||
1.基于改進的Mel頻率尺度和相位修正的耳語音增強算法,其特征在于:
根據耳語音的特點,對正常語音的標準Mel頻帶進行了重新劃分,在研究耳語音的共振峰頻率和能量以及耳語音聽覺模型的基礎上,提出了一種其改進的Mel頻率尺度(稱為Mel_m尺度),在此基礎上,對Mel_m尺度進行了改進并針對耳語音提出了一種新的尺度劃分方法,稱為Mel_improved尺度;
首先,假設線性頻率從500Hz開始映射,則Mel_m頻率映射可以設置如下:
Mel_m(fwhispered)=C·log10(1+fwhispered/q)fwhispered≥500Hz (1)
其次,由于耳語音的第一共振峰比正常語音向上偏移1.3倍,因此可以認為在第一共振峰F1附近存在以下公式:
fwhispered=1.3·fnormal (2)
結合公式(1),公式(2)和可以得到以下結果:
因此,線性頻率與Mel_m頻率之間的映射關系如下:
Mel_m(fwhispered)=2932·log10(1+fwhispered/910)fwhispered≥500Hz (4)
與正常語音的標準Mel頻率映射相比,Mel_m尺度有少量的修改,其更適合于處理正常語音。
2.根據權利要求1所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法,其特征在于:
Mel_m尺度可以解決耳語音中第一共振峰F1偏移的問題,但是仍存在人耳敏感區從F1向F2偏移的問題,這是由公式(1)引起的,因為它仍是一個對數函數,對數曲線的特點是低頻權重大,高頻權重小,根據耳語音的感知特性,需要使用頻率映射函數來抑制高、低頻,增強中間頻率,通常,考慮到耳語音的第二共振峰的頻率范圍約為1500-2500Hz,則兩者頻率的映射如下:
最后,為了滿足映射函數的連續性及對第二共振峰頻率權值的加重,Mel_improved尺度的頻率映射公式是:
與標準Mel頻率尺度相比,Mel_m尺度提高了第一共振峰偏移的權重,并且改進的Mel_improved尺度映射對第二共振峰權值的加重明顯優于前兩種類型。
3.根據權利要求1所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法,其特征在于:
在計算補償相位譜時,第一步是利用加性的實數與頻率相關的補償函數對含噪耳語音的復頻譜進行補償:
YΓ(n,k)=Y(n,k)+Γ(n,k) (7)
其中,相位譜補償函數Γ(n,k)由以下給出:
其中,Γ(n,k)應是關于F/2(采樣率的一半)的反對稱函數,以此來實現消除效果,λ是一個實數,其是由經驗所確定的常數,φ(k)是反對稱函數。
4.根據權利要求3所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法,其特征在于:
時不變反對稱函數由下式給出:
其中,對應于DSTF的非共軛向量的值是零加權的,由于噪聲幅度估計是對稱的,所以乘以時不變的反對稱函數φ(k)得到一個反對稱函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京師范大學,未經南京師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910146887.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種混響抑制系統及方法
- 下一篇:一種基于小波閾值濾波的音頻采集系統及方法





