[發明專利]基于約束低秩與稀疏分解的子空間語音增強方法在審
| 申請號: | 201810695775.3 | 申請日: | 2018-06-29 |
| 公開(公告)號: | CN108899045A | 公開(公告)日: | 2018-11-27 |
| 發明(設計)人: | 莊遷政;李曉東;原帥;王文豪;胡墨;裘旭益;岳新啟;孫成立 | 申請(專利權)人: | 中國航空無線電電子研究所 |
| 主分類號: | G10L21/0224 | 分類號: | G10L21/0224;G10L21/0272 |
| 代理公司: | 上海和躍知識產權代理事務所(普通合伙) 31239 | 代理人: | 楊慧 |
| 地址: | 200233 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 低秩 語音增強 子空間 低秩矩陣 稀疏分解 稀疏矩陣 噪聲環境 有效秩 語音 對角線 矩陣 分解 合成分析法 純凈語音 迭代重復 平均運算 實時處理 輸出語音 增強信號 逐幀處理 非穩態 構造帶 迭代 分幀 可用 時域 穩態 噪聲 應用 | ||
本發明公開了一種基于約束低秩與稀疏分解的子空間語音增強方法,包括如下步驟:(1)對含噪語音進行分幀;(2)對每一幀含噪語音,在時域上構造帶噪矩陣Y;(3)對Y進行SVD分解,根據SVD分解結果,利用合成分析法來確定純凈語音的有效秩P;(4)對Y進行低秩和稀疏矩陣分解,得到低秩矩陣L;(5)對得到的L的對角線進行平均運算,從中提取增強信號;(6)對每一幀迭代重復上面的步驟,達到迭代次數后輸出語音信號。本發明具備了子空間方法和低秩和稀疏矩陣分解的優點:可以在線逐幀處理數據,因而可用于實時處理的語音增強任務;可以根據噪聲環境自動估計低秩矩陣的有效秩;可以應用于任意的噪聲環境,包括穩態和非穩態噪聲。
技術領域
本發明涉及于語音信號處理技術領域,是一種對含噪語音進行降噪的方法,特別是基于約束低秩與稀疏分解的子空間語音降噪方法。
背景技術
語音是最有效、最常用和最方便的交流手段之一。近些年,隨著信息科學技術的不斷向前發展,語音更是成為人機交互的重要手段。智能語音處理技術在許多領域有著廣泛的應用前景。但在實際環境中,語音信號總要伴隨不同程度的噪聲干擾。甚至當干擾嚴重時,語音信號會完全淹沒于噪聲中,造成聽覺質量的嚴重下降。語音增強是解決噪聲污染的有效技術。語音增強通過抑制噪聲對語音的干擾,使得增強處理的語音信號同原始純凈語音信號之間的失真最小。過去幾十年來,涌現了各種各樣的語音增強算法。目前典型的三大類算法(P.C.Loizou,Speech Enhancement:Theory and Practice.New York:Taylor&Francis,2007)包括譜減法、基于譜幅度最小均方誤差、子空間法。其中,子空間方法由于其良好的降噪性能受到廣泛的關注,是目前語音降噪的主流方法。
子空間方法的工作原理如下:純凈語音可以被視為含噪語音歐式(Euclidean)空間中的一個子空間。因而,可以尋求一種方法,把含噪語音向量空間分解為一個純凈語音主導的子空間(簡稱信號子空間)和噪聲信號主導的子空間(簡稱噪聲子空間),通過將噪聲子空間置零,同時去除信號子空間中的噪聲成分,從而獲得純凈語音的估計值。在子空間方法中,如何將含噪語音進行有效的子空間劃分,是其中的最核心問題。目前,將含噪語音進行子空間分解,廣泛采用線性代數中大家熟知的正交矩陣分解技術,典型的算法包括奇異值分解(singular value hard,SVD)或特征值分解(eigenvalue decomposition,ED)。這兩種分解的目的都是求取含噪語音的低秩矩陣,即信號子空間。在基于SVD的子空間算法步驟中,首先將帶噪語音信號排列成一個Hankel(或Toeplitz)矩陣。由于純凈語音信號在時域是比較平緩的,可以理解為純凈語音信號排列構成的Hankel(或Toeplitz)矩陣是一個秩值較低的低秩矩陣,因此可用SVD分解獲得低秩矩陣。當低秩矩陣的秩近似等于純凈語音的秩時,原矩陣的低秩化近似隱含地忽略了信號子空間的最后消去的列所張成的正交子空間,從而得到增強的語音信號。然而,當數據出現大噪聲或離群異常值時,SVD的分解性能將嚴重下降,少數的異常值就可以帶來較大的分解誤差。因此,在強噪聲條件下,采用傳統分解方法(例如SVD和ED分解)獲得的低秩矩陣誤差很大,從而導致現有子空間方法在低信噪比環境下的工作性能差,語音降噪性能嚴重下降。
RPCA(Robust Principal Component Analysis)是美國加州理工學院的E.Candes教授和UIUC大學的J.Wright共同提出了一種新的數據分解方法(E.J.Candes,et al.,Robust Principal Component Analysis,Journal of the ACM,vol.58,pp.1-37,2011.),該方法可以在出現大噪聲或離群異常值時,通過對觀測數據的進行低秩與稀疏矩陣分解(low-rank and sparse matrix decomposition,簡稱LS分解),從強噪聲或異常值中有效地分離出原始低秩矩陣。RPCA目前已經應用于多個研究領域,包括監控的視頻目標與背景分離、圖像陰影去除、文檔檢索、歌曲中的伴奏音與語音分離。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國航空無線電電子研究所,未經中國航空無線電電子研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810695775.3/2.html,轉載請聲明來源鉆瓜專利網。





