[發明專利]一種基于深度神經網絡的噪聲魯棒盲混響時間估計方法有效
| 申請號: | 202210004710.6 | 申請日: | 2022-01-04 |
| 公開(公告)號: | CN114255780B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 鄭成詩;鄭凱桐;桑晉秋;張玉龍;張芳杰;李曉東 | 申請(專利權)人: | 中國科學院聲學研究所 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0216;G10L21/0232;G10L25/30;G10L19/16;G06N3/08 |
| 代理公司: | 北京方安思達知識產權代理有限公司 11472 | 代理人: | 陳琳琳;李彪 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 神經網絡 噪聲 魯棒盲 混響時間 估計 方法 | ||
本發明公開了一種基于深度神經網絡的噪聲魯棒盲混響時間估計方法,所述方法包括:對采集的語音信號進行預處理;將預處理后的語音信號輸入預先建立和訓練好的混響時間估計模型,得到混響時間值;所述混響時間估計模型基于深度神經網絡和時頻掩膜實現。本發明的方法利用混響語音進行房間混響時間估計,省去了傳統聲學測量所需要的專業的儀器與測量人員,相比于傳統聲學測量方法更加方便快捷;通過收集大量混響語音數據集,采用數據驅動的深度神經網絡,可以顯著提高房間混響時間估計的準確性。
技術領域
本發明屬于噪聲魯棒盲混響時間估計方法技術領域,尤其涉及一種基于深度神經網絡的噪聲魯棒盲混響時間估計方法。
背景技術
當聲音從封閉空間中的聲源處傳播到觀測點時,在房間將產生多次反射聲。這一物理過程產生了混響,即在關閉聲源后,室內產生的聲音在一段時間內仍可被聽到。聲音停止發聲時減少60分貝所花費的時間被定義為混響時間(T60),它主要取決于房間的幾何形狀和表面的反射率。ISO標準中規定的混響時間測量方法有中斷聲源法以及脈沖響應反向積分法。中斷聲源法需要使用十二面體球形聲源發出全頻帶噪聲,使得標準傳聲器處的聲壓級大于本底噪聲至少45dB以上,關閉聲源,記錄聲能量曲線(EDC),通過EDC算得混響時間,中斷聲源法需要在房間中取多點進行平均,在每點都需要多次測量取平均。脈沖響應反向積分法需要對房間沖激響應(RIR)進行反向積分得到聲能量衰減曲線。房間沖激響應可以通過在聲源處輸入掃頻等寬帶信號作為激勵信號,在傳聲器處接收經過房間傳播的激勵信號,再利用激勵信號與傳聲器處接收的信號進行解卷積求出。傳統的測量方法需要專業儀器、專業人員進行測量,不利于大規模測量混響時間。因此,需要提出一種方便快捷的盲混響時間估計方法。
盲混響時間估計方法指的是直接從混響語音錄音中估計T60。這就意味著在沒有任何關于聲環境或說話人先驗信息的情況下,輸入混響語音錄音,估計算法直接輸出估計的T60。幾十年來,人們提出了許多盲T60估計方法,包括基于傳統信號處理和基于機器學習的方法。
在真實的聲學環境中,語音不僅包含混響,還包含噪聲。噪聲和晚期混響具有類似的性質,在存在噪聲的情況下,混響聲被淹沒在噪聲中,從而降低T60估計器的估計性能。因此,提出一種噪聲魯棒的盲混響時間估計方法是十分必要的。
以往的相關專利或論文均未采用過此種方法來搭建噪聲魯棒盲混響時間估計模型。
發明內容
本發明的目的在于克服現有技術缺陷,提出了一種基于深度神經網絡的噪聲魯棒盲混響時間估計方法。
為了實現上述目的,本發明提出了一種基于深度神經網絡的噪聲魯棒盲混響時間估計方法,所述方法包括:
對采集的語音信號進行預處理;
將預處理后的語音信號輸入預先建立和訓練好的混響時間估計模型,得到混響時間值;
所述混響時間估計模型基于深度神經網絡和時頻掩膜實現。
作為上述方法的一種改進,所述對采集的語音信號進行預處理;具體包括:
使用設定毫秒的漢寧窗口,根據設定的幀移和傅里葉變換點數,對采集的語音信號進行短時傅里葉變換,得到多維的頻率特征。
作為上述方法的一種改進,所述混響時間估計模型為第一模型或第二模型;其中,
所述第一模型包括串聯的噪聲估計網絡和混響時間估計網絡;預處理后的語音信號同時輸入噪聲估計網絡和混響時間估計網絡,輸出為語音信號的混響時間值;
所述第二模型包括串聯的去噪網絡和混響時間估計網絡;預處理后的語音信號輸入去噪網絡,輸出為語音信號的混響時間值。
作為上述方法的一種改進,所述第一模型的噪聲估計網絡包括編碼器、MG-TCNs模塊和解碼器,其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所,未經中國科學院聲學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210004710.6/2.html,轉載請聲明來源鉆瓜專利網。





