[發明專利]一種基于低一致性詞典和稀疏表示的音頻修復方法和系統在審
| 申請號: | 201611127253.0 | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN107039042A | 公開(公告)日: | 2017-08-11 |
| 發明(設計)人: | 漆進;秦金澤;王君地 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/107 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 611731 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 一致性 詞典 稀疏 表示 音頻 修復 方法 系統 | ||
技術領域
本發明屬于音頻信號處理領域,涉及一種音頻修復方法和系統,特別是一種采用低一致性詞典學習和稀疏表示的音頻修復技術。
背景技術
人們常常需要對受損的音頻信號進行數字修復,減少失真,以得到有效的音頻信息,因此音頻修復成為國內外研究熱點問題。音頻修復是音頻信號處理領域研究的常規問題之一,它是利用數字信號處理算法對受損音頻部分進行補全或者去除干擾,達到修復波形和增強音質的目的。在音頻修復之前,一般要分析受損音頻的類型,根據不同的受損類型設計不同的修復算法。在音頻修復中,常把受損類型分為脈沖干擾、削頂失真和片段丟失等三種情況。
音頻修復有廣泛的應用,在音頻傳輸過程中,通常在接收端進行此類處理,比如電話系統中的語音增強,它將帶限語音中丟失的高頻部分還原出來,使接收方聽到的語音更加真實。也會應用于對廣播電臺錄制的音頻、圖書館保存的音像資料,會議錄制的會議紀要等珍貴歷史音頻進行修復。同時也可以對網絡傳輸過程中丟包導致的音頻片段缺失進行修復。音頻修復還可以作為語音識別的前期處理,將音頻進行修復后再識別,會提高識別的準確率。
在稀疏理論中,信號被分解成一系列冗余基函數(也稱原子)的線性組合,其中稀疏系數表示不同原子在組合中的比重,通常這些原子(單詞)集合稱為詞典或字典。在信號的線性組合中,如果非零系數很少,換言之,只需要少量原子就可以表示該信號,則該信號被認為是稀疏的。研究表明,當使用冗余函數集來分解信號時,稀疏表示的效果會增強。音頻信號也被認為是一種稀疏信號,如果字典設計合理,則將每幀信號在該字典上分解時,組合系數中只有少量系數是非零的。在冗余字典上對音頻進行稀疏表示,本質是一個非凸的l0范數最小化問題,在數學上它是NP難問題,無法得到解析解。工程上,一般采用逼近算法(如正交匹配追蹤算法OMP)來得到局部最優值。
稀疏表示理論的研究發展,為音頻修復問題提供了一種新的解決方案。對于受損的音頻,通常是某幾幀出現片段缺失或者削頂,而它的相鄰幀是完好的。雖然部分幀丟失,但是因為冗余信息的存在,可以利用周圍幀的有用信息,通過稀疏表示和稀疏重構原理,將受損部分幀進行補全和修復。
在現有的稀疏表示方法中,很多方法使用固定字典,比如短時傅里葉變換字典或離散余弦變換字典,使用函數變換生成的固定字典通用性好,但是不能適應具體音頻的結構化信息,這就導致不同信號的時頻表示差異很大,字典無法對不同結構的信號,進行自適應調整,因而基于樣本數據的詞典學習方法受到廣泛關注。通常詞典的一致性(也就是單詞之間的相似性)越低,詞典的表示能力越強。然而大多數詞典學習方法并不能保證學習到的詞典具有較低的一致性。目前,在音頻修復方面,還沒有基于低一致性詞典學習和稀疏表示的修復方法。為了解決上述音頻修復問題,本發明提出一種基于低一致性詞典學習和稀疏表示的音頻修復方法,該方法自動從音頻樣本數據中學習具有低一致性的詞典,然后使用該詞典對受損測試音頻進行稀疏重構,在重構的過程中保證未受損位置的重構信號與測試音頻中在未受損位置的信號盡可能一致,這樣在受損位置處的重構信號就是原始受損音頻修復后的信號。
發明內容
鑒于上述現有技術的不足,本發明所要解決的技術問題是如何針對不同的音頻信號,構造出符合他們結構特性的自適應字典,進而通過稀疏表示和稀疏重構,將受損部分幀進行補全和修復。
為實現上述目的,本發明提供了一種基于低一致性詞典學習和稀疏表示的音頻修復方法,其特征包括:
(1)分幀、加窗:使用窗函數對待修復的音頻信號進行分割成幀,從前到后對幀進行編號;
(2)掩碼處理:用掩碼矩陣與原始音頻相乘,把原始音頻分成可靠音頻和受損音頻兩部分,對受損部分幀序列獨立進行修復;
(3)構造過完備字典:將(2)中的可靠音頻部分作為訓練集,在訓練數據集上,學習一個自適應字典;
(4)低一致性字典學習:計算(3)中字典的Gram矩陣,矩陣中非對角線元素是字典中任意兩個原子的相關性。然后將相關性值與給定的閾值進行比較,并對大于閾值的兩個原子進行標記聚類。經過原子劃分之后,大于閾值的原子已經兩兩聚類,然后利用并行算法,對聚類的原子兩兩解耦合,也就是降低原子間的相關性,得到具有低一致性的自適應字典;
(5)稀疏編碼:結合(4)中訓練后的低一致性字典,使用稀疏編碼方法,對可靠部分音頻進行稀疏表示,得到稀疏分解系數。
(6)信號的合成:通過稀疏重構將受損部分幀進行補全和修復,得到受損音頻的估計值,將其和可靠音頻的幀進行重疊相加,得到最終修復的音頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611127253.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:低壓電容器新型投切開關
- 下一篇:一種電力電纜過電流傳送系統及其控制方法





