[發明專利]一種語音信號增強的方法和裝置有效
| 申請號: | 200910236917.0 | 申請日: | 2009-10-27 |
| 公開(公告)號: | CN102054482A | 公開(公告)日: | 2011-05-11 |
| 發明(設計)人: | 劉霖;田康 | 申請(專利權)人: | 中國移動通信集團公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02 |
| 代理公司: | 北京鑫媛睿博知識產權代理有限公司 11297 | 代理人: | 龔家驊 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 信號 增強 方法 裝置 | ||
技術領域
本發明涉及通信技術領域,特別涉及一種語音信號增強的方法和裝置。
背景技術
隨著3G(3rd?Generation,第三代移動通信系統)的發展,可視電話業務得到了廣泛的應用??梢曤娫挊I務在實現基本通信的同時,可以讓通話雙方觀察到對方所處的通話場景,增強了用戶的使用感受。在可視電話通話過程中,為了讓攝像頭捕捉到通話雙方的實時通話場景圖像,通話雙方在通話時需要與手機話筒保持一定的距離,因此,手機話筒采集到的通話語音信號中混入了大量的噪聲,噪聲的引入降低了通話信號的信噪比,影響了可視電話的通話質量。
在現有技術中,為了降低噪聲對通話質量的干擾,將帶噪語音信號經傅里葉變換變換到頻域,在頻域對帶噪語音信號進行譜相減算法,從帶噪語音的幅度譜中減去噪聲的幅度譜,得到純凈語音的幅度譜,其原理如下所示:
帶噪語音模型為:
y(n)=s(n)+d(n)????????式(1)
其中,y(n)代表帶噪語音,s(n)代表純凈語音,d(n)代表混入的噪聲。
對式(1)兩邊作傅里葉變換,可得:
Y(k)=S(k)+D(k)????????式(2)
其中,Y(k)代表帶噪語音的傅里葉系數,S(k)代表純凈語音的傅里葉系數,D(k)代表噪聲的傅里葉系數。
忽略帶噪語音和純凈語音之間的相位差異,可得:
|Y(k)|=|S(k)|+|D(k)|??式(3)
利用人耳對于相位信息的不敏感性,可以直接從帶噪語音的幅度譜中減去噪聲的幅度譜,得到純凈語音的幅度譜,并作為得到的增強語音的幅度譜。由此得到基本的表達式為:
式(4)
而在實際使用過程中,更多使用的是譜相減的改進形式,式(5)為譜相減的改進形式:
這種改進形式的譜相減算法與普通譜相減算法的差別在于引入了α和β兩個參數,參數的引入給譜相減算法提供了很大的靈活性。對帶噪語音進行譜相減的系統原理,如圖1所示。
然而,現有技術中利用譜相減算法消減噪聲的過程存在如下技術缺陷:對帶噪語音進行頻譜相減時,無法準確的判斷噪聲頻譜和語音頻譜,因此頻譜相減算法在消減噪聲的同時,也使得語音頻譜受到了較大的消減,影響了人類聽覺對正常語音頻譜的感知能力。
因此,基于現有技術中利用譜相減算法進行語音增強的過程中出現的對語音信號的削減,對現有的譜相減算法做了很多改進,通過調整頻譜相減中消減噪聲的強度,優化語音增強的性能。
方案1,根據帶噪語音的頻譜概率特性以及噪聲頻譜的概率特性,進行平均計算,用以控制消減噪聲幅度的強度;
方案2,將傳統譜相減算法中α=1,β=2,改為α=2,β=5,得到改進的譜相減法,利用訓練得到的系數,控制噪聲消減的強度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司,未經中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910236917.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:座椅傾斜裝置
- 下一篇:耐剝離性和耐磨性優異的金剛石包覆工具





