[發明專利]基于非負低秩和稀疏矩陣分解原理的語音增強方法有效
| 申請號: | 201310548773.9 | 申請日: | 2013-11-07 |
| 公開(公告)號: | CN103559888A | 公開(公告)日: | 2014-02-05 |
| 發明(設計)人: | 孫成立;須明;王希敏;謝堅筱 | 申請(專利權)人: | 航空電子系統綜合技術重點實驗室 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0272 |
| 代理公司: | 南昌市平凡知識產權代理事務所 36122 | 代理人: | 歐陽沁 |
| 地址: | 200233 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 非負低秩 稀疏 矩陣 分解 原理 語音 增強 方法 | ||
技術領域
本發明涉及信號處理領域,適用于含噪語音的噪聲抑制,特別是基于非負低秩和稀疏矩陣分解原理的語音增強方法。
背景技術
語音信號是人類交流信息最自然、最有效的手段。隨著人類進入信息化時代,迫切需要使用先進的語音處理技術來促進人類社會智能化。早在2000年,比爾蓋茨就曾提出“未來10年是語音的時代”。最近幾年,隨著蘋果、谷歌、微軟等公司先后推出智能語音服務,智能語音產業已經成為信息技術領域中的新興產業,用戶認知度和市場規模正在逐漸擴大。特別是蘋果新近推出的智能手機具有語音助理功能,以及科大訊飛的語音“云技術”推出,使智能語音技術面臨更加廣闊的應用。然而,語音通信和應用過程中不可避免地受到來自周圍環境、傳播媒介和通信設備內部噪聲的干擾,嚴重影響了智能語音技術的實際應用。
語音增強是解決噪聲污染的有效技術。語音增強通過抑制噪聲對語音的干擾,使得增強處理的語音信號同原始純凈語音信號之間的失真最小。過去幾十年來,涌現了許多語音增強算法,典型的算法包括譜減法、基于譜幅度最小均方誤差、子空間法、小波降噪法。在信噪比較高的環境下語音增強已經得到了有效解決。然而,由于自然環境中噪聲的多樣性及語音信號本身的復雜性,語音增強算法根據應用環境的不同而不同,這使得其研究工作難度很大,強噪聲和多種噪聲環境的語音增強問題仍然沒有得到很好解決。
在現有的語音增強算法中,許多方法試圖使用語音信號和噪聲信號的概率密度模型來最大程度上的移除噪聲信號,然而近年研究表明單一的某種分布并不能適用于所有的語音或噪聲,需要更為靈活的數學模型和模型估計算法以適應信號自身的特點。此外,在現有語音增強算法中,噪聲估計是語音增強算法的前期必備工作。借助噪聲估計可以獲得噪聲功率譜和語音信號的先驗信噪比,對語音增強效果的改善至關重要。現有的語音增強方法通過語音端點檢測將采集到的語音信號分為噪聲段和含噪語音段,利用噪聲段來估計和更新噪聲估計量,然而這是一種次優估計方式,實際中噪聲段和含噪語音段的瞬時噪聲并不完全相符,因此,這種噪聲估計方法總會帶來誤差,況且現有語音端點檢測技術在低信噪比和非平穩噪聲環境下尚不成熟,容易造成誤判,會導致語音中存在很大的殘留噪聲。
近年的壓縮感知理論研究表明,許多實際的觀測量都可以歸結為一個低秩分量和稀疏分量相加的模式,借助矩陣的低秩和稀疏矩陣分解,可以從大噪聲或異常值污染數據中恢復原始數據信息。矩陣的低秩和稀疏矩陣分解已經用于圖像增強、視頻目標檢測、數據挖掘等許多科技領域。
平穩隨機噪聲和周期噪聲是最常見的兩種噪聲類別。平穩隨機噪聲用一階和二階統計量描述其隨機過程,它的均值和自相關函數與時間無關,由于隨機信號自相關函數的傅里葉變換是功率譜,因此平穩隨機噪聲的時頻矩陣是一個秩數為1的低秩矩陣。同樣,如果噪聲為周期性噪聲,由于其時頻矩陣只在某些固定頻率處有值,其矩陣列向量具有較強的相關性,必然也是一個低秩矩陣。
綜上所述,背景噪聲的時頻矩陣列向量具有很強的相關性,因此噪聲的時頻矩陣具有低秩性。相對背景噪聲而言,語音源信號在大部分時頻點上取值為零或者接近于零,只有少數采樣點處取值較大,所以語音源信號具有一定的稀疏性,適合用稀疏矩陣描述。因此,可以考慮借鑒矩陣的低秩和稀疏分解理論來解決語音增強問題。中國專利公開了一種基于低秩與稀疏矩陣分解的單通道無監督語噪分離方法(公開號:CN102915742A)。該方法首先使用短時傅里葉變換將帶噪語音時域波形變換到時頻域從而得到帶噪語音的幅度譜;利用低秩與稀疏矩陣分解算法將帶噪語音的幅度譜分解為噪聲幅度譜、語音幅度譜和殘余噪聲幅度譜三者之和;最后,利用短時傅里葉逆變換從語音的幅度譜中重構出的語音時域波形。該方法的不足在于沒有對低秩和稀疏矩陣分解加非負性約束,容易導致從帶噪語音幅度譜中分離得到的語音幅度譜含有負值結果。而實際的幅度譜是非負物理量,不應該出現負值現象。負值幅度譜不但引起分解誤差,而且會產生人耳感覺難受的音樂噪聲,從而影響語音聽覺質量。
本發明設計了一種基于非負低秩和稀疏矩陣分解原理的語音增強方法,該方法采用非負低秩和稀疏矩陣分解原理分解含噪語音幅度譜,能使分解獲得的語音幅度譜滿足非負性,有效提高低秩與稀疏矩陣分解效果。該方法具有魯棒性強、不需要進行端點檢測、以及參數少易調節等優點,適合強噪聲環境下的語音增強任務。
發明內容
本發明所要解決的技術問題是提供一種基于非負低秩和稀疏矩陣分解原理的語音增強方法,通過在時頻域中引入噪聲和語音的低秩和稀疏約束、以及非負性約束來進行低秩和稀疏矩陣分解,實現含噪語音的語噪分離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航空電子系統綜合技術重點實驗室,未經航空電子系統綜合技術重點實驗室許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310548773.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種蛋氨酸的生產方法
- 下一篇:一種方便、即食型甜酒的加工方法





