[發(fā)明專利]消除回聲的方法、裝置、電子設(shè)備及可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202010588570.2 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111798863A | 公開(公告)日: | 2020-10-20 |
| 發(fā)明(設(shè)計)人: | 任偉 | 申請(專利權(quán))人: | 北京梧桐車聯(lián)科技有限責(zé)任公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 謝冬寒 |
| 地址: | 100089 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 消除 回聲 方法 裝置 電子設(shè)備 可讀 存儲 介質(zhì) | ||
本申請公開了一種消除回聲的方法、裝置、電子設(shè)備及可讀存儲介質(zhì),屬于語音識別技術(shù)領(lǐng)域。方法包括:接收至少一個第一音頻,按照第一增益閾值對第一音頻進(jìn)行回聲消除處理,得到處理后的第一音頻。基于處理后的第一音頻確定回聲殘留概率,回聲殘留概率用于指示按照第一增益閾值進(jìn)行回聲消除處理之后的回聲殘留程度。響應(yīng)于回聲殘留概率大于概率閾值,將第一增益閾值增大至第二增益閾值,第二增益閾值用于對第一音頻之后接收到的第二音頻進(jìn)行回聲消除處理。本申請根據(jù)回聲殘留概率對用于回聲消除處理的增益閾值進(jìn)行了及時調(diào)整,因而避免了回聲殘留,使得回聲消除的更為徹底。因此,提高了回聲消除效果。
技術(shù)領(lǐng)域
本申請涉及語音識別技術(shù)領(lǐng)域,特別涉及一種消除回聲的方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。
背景技術(shù)
隨著語音識別技術(shù)的發(fā)展,語音識別的應(yīng)用場景也越來越多,車載場景便是其中一種。在車載場景中,用于語音識別的音頻往往包含用戶發(fā)出的近端音頻以及回聲,回聲是指揚(yáng)聲器播放的遠(yuǎn)端音頻經(jīng)車內(nèi)物品反射得到的音頻。由于回聲會影響對近端音頻的語音識別效果,因而需要對回聲進(jìn)行消除。
相關(guān)技術(shù)中,首先采用自適應(yīng)濾波的方式對音頻中的線性回聲進(jìn)行消除。之后,對于音頻中殘留的非線性回聲,設(shè)置固定的增益閾值。若音頻中存在部分音頻的增益小于該門限值,則將該部分音頻作為非線性回聲進(jìn)行消除。
然而,在音頻中回聲的增益大于增益閾值的情況下,若采用相關(guān)技術(shù)提供的方法,則會將該種回聲也作為近端音頻進(jìn)行保留。可見,相關(guān)技術(shù)提供的方法對回聲消除的不夠徹底,消除效果較差。
發(fā)明內(nèi)容
本申請實施例提供了一種消除回聲的方法、裝置、電子設(shè)備及可讀存儲介質(zhì),以解決相關(guān)技術(shù)對回聲消除不夠徹底、消除效果較差的問題。所述技術(shù)方案如下:
一方面,提供了一種消除回聲的方法,所述方法包括:
接收至少一個第一音頻,按照第一增益閾值對所述第一音頻進(jìn)行回聲消除處理,得到處理后的第一音頻;
基于所述處理后的第一音頻確定回聲殘留概率,所述回聲殘留概率用于指示按照所述第一增益閾值進(jìn)行回聲消除處理之后的回聲殘留程度;
響應(yīng)于所述回聲殘留概率大于概率閾值,將所述第一增益閾值增大至第二增益閾值,所述第二增益閾值用于對所述第一音頻之后接收到的第二音頻進(jìn)行回聲消除處理。
在示例性實施例中,所述將所述第一增益閾值增大至第二增益閾值之后,所述方法還包括:
接收所述第二音頻,按照所述第二增益閾值對所述第二音頻進(jìn)行回聲消除處理,得到處理后的第二音頻;
基于所述處理后的第二音頻確定所述第二增益閾值對應(yīng)的誤消除概率;
響應(yīng)于所述第二增益閾值對應(yīng)的誤消除概率大于所述第一增益閾值對應(yīng)的誤消除概率,將所述第二增益閾值減小至第三增益閾值,所述第三增益閾值用于對所述第二音頻之后接收到的其他音頻進(jìn)行回聲消除處理,所述第三增益閾值大于所述第一增益閾值。
在示例性實施例中,所述基于所述處理后的第二音頻確定所述第二增益閾值對應(yīng)的誤消除概率,包括:
對所述處理后的第二音頻進(jìn)行語義識別,確定被正確識別出語義的處理后的第二音頻的第一數(shù)量,以及未被正確識別出語義的處理后的第二音頻的第二數(shù)量;
將所述第一數(shù)量與所述第二數(shù)量之和作為第三數(shù)量,將所述第二數(shù)量與所述第三數(shù)量的比值作為所述第二增益閾值對應(yīng)的誤消除概率。
在示例性實施例中,所述確定被正確識別出語義的處理后的第二音頻的第一數(shù)量,以及未被正確識別出語義的處理后的第二音頻的第二數(shù)量,包括:
對于任一個處理后的第二音頻,確定所述任一個處理后的第二音頻對應(yīng)的特征值,所述特征值用于指示識別出正確語義的概率;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京梧桐車聯(lián)科技有限責(zé)任公司,未經(jīng)北京梧桐車聯(lián)科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010588570.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:柔性壓力測量傳感器和壓力分布測量系統(tǒng)
- 下一篇:電池模塊





