[發明專利]一種適用于語音壓縮感知的過完備字典構造方法無效
| 申請號: | 201210380638.3 | 申請日: | 2012-10-10 |
| 公開(公告)號: | CN102881293A | 公開(公告)日: | 2013-01-16 |
| 發明(設計)人: | 孫林慧;楊震;楊真真 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G10L19/12 | 分類號: | G10L19/12 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 許方 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 適用于 語音 壓縮 感知 完備 字典 構造 方法 | ||
技術領域
本發明屬于信號采樣及語音信號處理領域,特別涉及一種適用于語音壓縮感知的過完備字典構造新方法。
背景技術
語音是人類最方便直接的交流方式,傳統的語音信號處理都基于Nyquist(奈奎斯特)采樣定理,首先進行2倍帶寬以上的高速采樣,然后根據樣值之間存在的強相關性再壓縮,這一過程浪費了大量的采樣資源。Nyquist采樣定理是大多數信號采樣所遵循的規律,表明了采樣頻率與信號頻譜分布之間的關系,是任何信號精確重構的充分條件,但不一定是必要條件。如何根據語音信號的特殊性,對語音信號重新建模以獲得更少的采樣但又不影響語音的重構質量,是當前語音信號處理領域中的研究熱點。
2004年由Donoho與Candes等人提出的壓縮感知(Compressed?Sensing,CS)理論是基于信號在某個域的稀疏性建立的線性、非自適應采樣的新理論,表明具有稀疏性的壓縮感知技術能獲得較經典奈氏理論更好的壓縮性能,信號的稀疏性或可壓縮性是實現壓縮重構的必要條件之一。CS理論表明,可以在不丟失逼近原信號所需信息的情況下,用最少的觀測數來采樣信號,實現信號的降維處理,即直接對信號進行較少采樣得到信號的壓縮表示,從而在節約采樣和傳輸成本的情況下,達到了在采樣的同時進行壓縮的目的。CS突破了傳統的奈奎斯特采樣定理的限制,從傳統的信號采樣轉變成信息采樣。只要信號是可壓縮的或在某個域上是稀疏的,就可以利用隨機觀測矩陣直接將這樣一個高維信號投影到低維空間上,可以利用這些少量的觀測重構原信號。壓縮感知重構過程中僅僅考慮了信號的稀疏性先驗,而沒有考慮任何關于信號結構的信息,通過隨機觀測包含了重構信號的足夠信息。當信號具有稀疏性或可壓縮性時,通過采集少量的信號觀測值就可實現信號的準確或近似重構。
由于語音信號具有可壓縮性,能夠用比Nyquist采樣速率低很多的速率無失真地采樣信號,基于壓縮感知進行低速率無失真地采樣給信號的采樣、存儲、傳輸和處理都帶來了巨大的方便。所以CS理論與語音信號處理領域的結合,意味著對傳統的基于奈奎斯特均勻采樣定律下的語音分析方法的顛覆——用CS理論中的觀測來代替傳統語音采樣值,勢必導致采樣信號特征根本性的變化,進而影響整個語音信號處理體系。將CS與語音信號相結合來探求語音信號處理領域的各種新方法具有很好的現實意義。CS壓縮采樣下重構信號性能與采樣時采用的觀測矩陣和重構時采用的轉換矩陣有很大關系,觀測矩陣多是高斯隨機矩陣,轉換矩陣目前絕大部分壓縮感知中都應用正交基,少量的利用非正交冗余變換作為語音重構的稀疏表示方法。在觀測數相同的情況下,語音表示越稀疏,則重構語音的質量越高,即轉換矩陣的選擇對信號重構性能來說很重要。語音信號采用離散余弦變換(Discrete?Cosine?Transform,DCT)基、小波基進行單一尺度的非自適應壓縮感知重構時,當觀測個數是原數值個數一半及以下時,其重構性能很差,主要因為語音信號在常規正交基下的稀疏性不夠好導致重建信號性能較差。構造一種適用于語音壓縮感知的過完備字典是語音壓縮感知走向實用的關鍵。語音信號在基于訓練碼本構造的過完備線性預測(Overcomplete?Linear?Prediction,OLP)字典下呈現良好的稀疏性,基于過完備線性預測字典的語音壓縮感知重建信號性能良好,并且具有較高的魯棒性。基于此點,本案由此產生。
發明內容
本發明的目的,在于提供一種適用于語音壓縮感知的過完備字典構造方法,其預先由訓練語音的預測系數聚類構造過完備字典,不需要測試語音的預測系統,且構造方法簡單,語音信號在過完備線性預測字典下呈現良好的稀疏性,基于過完備線性預測字典的語音壓縮感知重構信號性能良好,且具有較好的魯棒性。
為了達成上述目的,本發明的解決方案是:
一種適用于語音壓縮感知的過完備字典構造方法,包括如下步驟:
(1)在訓練階段由大量的訓練語音構造過完備的線性預測字典,包括如下內容:
(11)對同一說話人的訓練語音信號進行線性預測分析,得到線性預測系數矢量;
(12)通過聚類算法由大量線性預測系數矢量構造線性預測系數矢量碼本;
(13)每個碼矢構造一個矩陣,求逆得到相應的線性預測矩陣;
(14)所有的矩陣一起構成過完備的線性預測字典;
(2)在實測階段采用隨機高斯矩陣作為觀測矩陣對語音信號進行CS采樣;
(3)基于前述線性預測字典采用BP算法高質量重構語音信號。
上述步驟(12)中,采用LBG算法構造矢量碼本,具體實現步驟為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210380638.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:便攜式梳妝臺
- 下一篇:一種適用于全自動血細胞分析儀的樣本加注的方法及裝置





