[發明專利]一種基于LSTM的后期混響抑制方法及系統在審
| 申請號: | 202010023100.1 | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN111462770A | 公開(公告)日: | 2020-07-28 |
| 發明(設計)人: | 計健雄;郭鵬 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0224;G10L25/12;G10L25/18;G10L25/30;G10L25/45 |
| 代理公司: | 華中科技大學專利中心 42201 | 代理人: | 李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lstm 后期 混響 抑制 方法 系統 | ||
本發明公開了一種基于LSTM的后期混響抑制方法及系統,包括以下步驟:S1、對待處理的混響語音信號進行分幀,并提取各幀的頻譜特征序列;S2、將所得各幀的頻譜特征序列依次輸入到預訓練好的后期混響抑制網絡中,對所述頻譜特征序列中的后期混響特征進行抑制,得到各幀的增強信號特征序列;S3、對所得各幀的增強信號特征序列進行恢復,得到后期混響抑制后的語音信號;其中,增強信號特征包括干語音和前期反射信號特征;通過基于LSTM的后期混響抑制網絡,在時間序列上對語音信號進行建模,對頻譜特征序列中的后期混響特征進行實時過濾,且僅對后期這種強烈的混響進行了抑制,并不抑制前期反射,能夠做到適量的混響抑制,混響抑制后的聲音聽覺效果較好。
技術領域
本發明屬于語音信號處理領域,更具體地,涉及一種基于LSTM的后期混響抑制方法及系統。
背景技術
聲波在室內傳播時,要被墻壁、天花板、地板等障礙物反射,每反射一次都要被障礙物吸收一些。當聲源停止發聲后,聲波在室內要經過多次反射和吸收,最后才消失,我們就感覺到聲源停止發聲后聲音還會繼續一段時間,這種現象叫做混響。適量的混響能使聲音圓潤動聽,聽起來有空間感,但是強烈的后期混響會嚴重降低語音清晰度和聲音質量,在語音信號處理領域,影響語音識別系統的語音識別性能和聲音質量。故研究一種后期混響抑制方法及系統具有重要的意義。
在傳統的去混響算法中,大多采用單通道去混響算法,例如采用頻譜減法算法,通過假設混響的指數衰減模型來抑制后期混響,當室內物品較多,室內環境比較復雜時,這種混響的衰減模型并不能很好的估計混響的真實模型,去混響的效果不佳,適用范圍有限;另外,該方法還需要已知混響時間這一參數,易導致譜失真。為了解決以上問題,現有的語音混響抑制方法基于監督語音增強算法,如采用深度神經網絡(Deep Neural Networks,DNN)從混響語音的對數譜到無聲語音的對數信息幅度譜中學習映射函數,進行混響抑制,該方法需要預先收集大量的數據進行訓練,且是一種非因果方法,無法對時間序列上的變化進行建模,同時無法利用上下文時間信息對混響進行估計,無法適用于實時的語音識別系統;另外,該方法在抑制過程中未考慮語音信號時域上的關聯信息,并且沒有區分后期混響和前期反射,除了對后期這種強烈的混響進行了抑制,同時也抑制了前期反射,直接導出干語音,無法做到適量的混響抑制,混響抑制后的聲音聽覺效果不佳。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種基于長短期記憶循環神經網絡(Long Short Term Memory,LSTM)的后期混響抑制方法及系統,其目的在于解決現有技術由于同時抑制了后期混響和前期反射,且在抑制過程中并未考慮語音信號時域上的關聯信息而導致的混響抑制后聲音的聽覺效果不佳的技術問題。
為實現上述目的,第一方面,本發明提供了一種基于LSTM的后期混響抑制方法,包括以下步驟:
S1、對待處理的混響語音信號進行分幀,并提取各幀的頻譜特征序列;
S2、將所得各幀的頻譜特征序列依次輸入到預訓練好的后期混響抑制網絡中,對所述頻譜特征序列中的后期混響特征進行抑制,得到各幀的增強信號特征序列;
S3、對所得各幀的增強信號特征序列進行恢復,得到后期混響抑制后的語音信號;
其中,增強信號特征包括干語音和前期反射信號特征;后期混響抑制網絡為基于LSTM的網絡,用于根據語音信號在時域上的關聯信息,對頻譜特征序列中的后期混響特征進行實時過濾。
本發明的有益效果是:通過基于LSTM的后期混響抑制網絡,在時間序列上對語音信號進行建模,通過考慮語音信號在時域上的關聯信息,對頻譜特征序列中的后期混響特征進行實時過濾,本發明僅對后期這種強烈的混響進行了抑制,并不抑制前期反射,能夠做到適量的混響抑制,混響抑制后的聲音聽覺效果較好。
上述技術方案的基礎上,本發明還可以做如下改進。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010023100.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:蓄電池組和具有蓄電池組的地面處理設備
- 下一篇:多模生物特征融合方法和系統





