[發明專利]基于改進的Mel頻率尺度和相位修正的耳語音增強算法在審

申請號：	201910146887.8	申請日：	2019-02-27
公開（公告）號：	CN109712638A	公開（公告）日：	2019-05-03
發明（設計）人：	李晨;韋怡;曾毓敏;李天峰	申請（專利權）人：	南京師范大學
主分類號：	G10L21/0232	分類號：	G10L21/0232;G10L21/0208
代理公司：	北京盛凡智榮知識產權代理有限公司 11616	代理人：	梁永昌
地址：	210023 江蘇省南京***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	耳語音算法頻率尺度噪聲估計尺度補償相位相位修正頻譜改進主觀聽力測試共振峰頻率客觀評價聽覺模型正常語音相位譜減去合成研究
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.基于改進的Mel頻率尺度和相位修正的耳語音增強算法，其特征在于：

根據耳語音的特點，對正常語音的標準Mel頻帶進行了重新劃分，在研究耳語音的共振峰頻率和能量以及耳語音聽覺模型的基礎上，提出了一種其改進的Mel頻率尺度(稱為Mel_{_m}尺度)，在此基礎上，對Mel_{_m}尺度進行了改進并針對耳語音提出了一種新的尺度劃分方法，稱為Mel_{_improved}尺度；

首先，假設線性頻率從500Hz開始映射，則Mel_{_m}頻率映射可以設置如下：

Mel_{_m}(f^whispered)＝C·log10(1+f^whispered/q)f^whispered≥500Hz (1)

其次，由于耳語音的第一共振峰比正常語音向上偏移1.3倍，因此可以認為在第一共振峰F1附近存在以下公式：

f^whispered＝1.3·f^normal (2)

結合公式(1)，公式(2)和可以得到以下結果：

因此，線性頻率與Mel_{_m}頻率之間的映射關系如下：

Mel_{_m}(f^whispered)＝2932·log10(1+f^whispered/910)f^whispered≥500Hz (4)

與正常語音的標準Mel頻率映射相比，Mel_{_m}尺度有少量的修改，其更適合于處理正常語音。

2.根據權利要求1所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法，其特征在于：

Mel_{_m}尺度可以解決耳語音中第一共振峰F1偏移的問題，但是仍存在人耳敏感區從F1向F2偏移的問題，這是由公式(1)引起的，因為它仍是一個對數函數，對數曲線的特點是低頻權重大，高頻權重小，根據耳語音的感知特性，需要使用頻率映射函數來抑制高、低頻，增強中間頻率，通常，考慮到耳語音的第二共振峰的頻率范圍約為1500-2500Hz，則兩者頻率的映射如下：

最后，為了滿足映射函數的連續性及對第二共振峰頻率權值的加重，Mel_{_improved}尺度的頻率映射公式是：

與標準Mel頻率尺度相比，Mel_{_m}尺度提高了第一共振峰偏移的權重，并且改進的Mel_{_improved}尺度映射對第二共振峰權值的加重明顯優于前兩種類型。

3.根據權利要求1所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法，其特征在于：

在計算補償相位譜時，第一步是利用加性的實數與頻率相關的補償函數對含噪耳語音的復頻譜進行補償：

Y_Γ(n,k)＝Y(n,k)+Γ(n,k) (7)

其中，相位譜補償函數Γ(n,k)由以下給出：

其中，Γ(n,k)應是關于F/2(采樣率的一半)的反對稱函數，以此來實現消除效果，λ是一個實數，其是由經驗所確定的常數，φ(k)是反對稱函數。

4.根據權利要求3所述的基于改進的Mel頻率尺度和相位修正的耳語音增強算法，其特征在于：

時不變反對稱函數由下式給出：

其中，對應于DSTF的非共軛向量的值是零加權的，由于噪聲幅度估計是對稱的，所以乘以時不變的反對稱函數φ(k)得到一個反對稱函數。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載