[發明專利]回聲消除方法、裝置及存儲介質在審
| 申請號: | 202010844040.X | 申請日: | 2020-08-20 |
| 公開(公告)號: | CN111951819A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 周新權;冷艷宏 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L21/0208;G10L21/0232;G10L25/30 |
| 代理公司: | 上海光柵知識產權代理有限公司 31340 | 代理人: | 喬慧;馬雯雯 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 回聲 消除 方法 裝置 存儲 介質 | ||
本申請提供一種回聲消除方法、裝置及存儲介質,該方法通過待處理數據中待處理遠端信號和待處理混合信號,以及預設神經網絡模型,獲得估計掩蔽值,其中,該預設神經網絡模型通過參考遠端信號、參考混合信號和目標掩蔽值訓練得到,進而,根據上述估計掩蔽值和上述待處理混合信號,獲得估計近端信號,即本申請實施例通過輕量卷積神經網絡進行回聲消除,不僅能夠完全抑制聲學回聲,而且能夠盡可能減小近端語音的失真,提高語音通話和交互的質量。另外,本申請實施例上述預設神經網絡模型的結構可以采用輕量網絡的結構,該結構參數量少,運算速度快,從而滿足手機、電腦或者其他硬件設備的實時要求。
技術領域
本申請涉及聲學回聲消除技術,尤其涉及一種回聲消除方法、裝置及存儲介質。
背景技術
聲學回聲是由遠端信號經過近端的揚聲器播放后被近端的傳聲器采集而得的信號。近端的傳聲器采集到信號中包含了聲學回聲和近端語音,如果不進行回聲消除,那么遠端房間中的說話人將會聽到自己的回聲,嚴重影響語音交互。因此聲學回聲消除是語音交互場景中不可或缺的模塊。
傳統的聲學回聲消除通常會采用雙講檢測模塊或者在雙講階段采用特殊的處理,比如雙濾波器等。這類算法通過估計回聲,然后將估計得到的回聲從近端混合信號中去除。
然而這種方法無法有效去除揚聲器產生的非線性失真,因此需要采用后處理方法來消除殘余的非線性回聲。常用的方法是通過估計信號回聲比(signal to echo ratio,SER)來去除殘余回聲。然而,傳統的殘余回聲消除系統很難準確估計殘余回聲,處理時對近端語音損失很大。
發明內容
為解決現有技術中存在的問題,本申請提供一種回聲消除方法、裝置及存儲介質。
第一方面,本申請實施例提供一種回聲消除方法,包括:
獲取待處理數據,所述待處理數據包括待處理遠端信號和待處理混合信號,所述待處理混合信號是近端信號與回聲信號混合得到的;
根據所述待處理遠端信號、所述待處理混合信號和預設神經網絡模型,獲得估計掩蔽值,其中,所述預設神經網絡模型通過參考遠端信號、參考混合信號和目標掩蔽值訓練得到;
根據所述估計掩蔽值和所述待處理混合信號,獲得估計近端信號。
在一種可能的實現方式中,所述根據所述待處理遠端信號、所述待處理混合信號和預設神經網絡模型,獲得估計掩蔽值,包括:
對所述待處理混合信號進行線性回聲消除處理,獲得處理后的混合信號;
將所述待處理遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型;
獲取所述預設神經網絡模型輸出的所述估計掩蔽值。
在一種可能的實現方式中,在所述將所述待處理遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型之前,還包括:
對所述待處理遠端信號進行延時抖動消除處理,獲得對齊的遠端信號;
所述將所述待處理遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型,包括:
將所述對齊的遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型。
在一種可能的實現方式中,在所述將所述對齊的遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型之前,還包括:
通過短時傅里葉變換,計算所述對齊的遠端信號的頻譜和所述處理后的混合信號的頻譜;
所述將所述對齊的遠端信號和所述處理后的混合信號,輸入所述預設神經網絡模型,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010844040.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于治療面部痤瘡的蒸熏美容儀
- 下一篇:MEMS壓力芯片及其制備方法





