[發(fā)明專利]殘留回聲抑制模型的訓(xùn)練方法和訓(xùn)練裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202111017286.0 | 申請(qǐng)日: | 2021-08-31 |
| 公開(公告)號(hào): | CN113707167A | 公開(公告)日: | 2021-11-26 |
| 發(fā)明(設(shè)計(jì))人: | 陳宏圣;樂笑懷;盧晶 | 申請(qǐng)(專利權(quán))人: | 北京地平線信息技術(shù)有限公司 |
| 主分類號(hào): | G10L21/0208 | 分類號(hào): | G10L21/0208;G10L21/0216;H04M9/08 |
| 代理公司: | 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 殘留 回聲 抑制 模型 訓(xùn)練 方法 裝置 | ||
本公開實(shí)施例公開了一種殘留回聲抑制模型的訓(xùn)練方法和訓(xùn)練裝置,其中,該訓(xùn)練方法包括:基于多個(gè)殘留回聲信號(hào)、多個(gè)背景噪音信號(hào)和多個(gè)近端語音信號(hào)生成多個(gè)混合音頻信號(hào);基于所述多個(gè)混合音頻信號(hào),確定與所述多個(gè)混合音頻信號(hào)對(duì)應(yīng)的多個(gè)輔助信號(hào);基于所述多個(gè)混合音頻信號(hào)和所述多個(gè)輔助信號(hào)訓(xùn)練殘留回聲抑制模型。本公開實(shí)施例可以對(duì)非線性的殘留回聲信號(hào)進(jìn)行有效抑制,進(jìn)而可以提升通話質(zhì)量,增強(qiáng)了用戶體驗(yàn)。
技術(shù)領(lǐng)域
本公開涉及回聲抑制技術(shù)領(lǐng)域,尤其是一種殘留回聲抑制模型的訓(xùn)練方法和訓(xùn)練裝置。
背景技術(shù)
在通信系統(tǒng)中,遠(yuǎn)端信號(hào)由揚(yáng)聲器系統(tǒng)轉(zhuǎn)換為聲信號(hào)后,經(jīng)回聲聲學(xué)路徑被傳聲器系統(tǒng)采集后將產(chǎn)生回聲信號(hào)。回聲信號(hào)將嚴(yán)重干擾語音通信的質(zhì)量,并降低語音識(shí)別系統(tǒng)的準(zhǔn)確性。抑制回聲信號(hào),提取近端說話人語音信號(hào)的技術(shù)稱為回聲抑制。
相關(guān)技術(shù)中,使用基于線性的回聲抑制方法,其通過匹配回聲傳遞路徑對(duì)應(yīng)的傳遞函數(shù)進(jìn)行回聲抑制。但是,當(dāng)回聲路徑存在不可忽視的非線性效應(yīng)時(shí),則該回聲抑制方式的性能將大幅下降,因此需要針對(duì)殘留回聲進(jìn)行抑制。
相關(guān)技術(shù)中使用遠(yuǎn)端信號(hào)和自適應(yīng)濾波器系數(shù)對(duì)殘留回聲的幅度進(jìn)行估計(jì),并依此對(duì)殘留回聲信號(hào)進(jìn)行抑制,但是難以在殘留回聲抑制和近端語音失真方面取得很好的平衡。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,提出了本公開。本公開的實(shí)施例提供了一種殘留回聲抑制模型的訓(xùn)練方法和訓(xùn)練裝置。
根據(jù)本公開實(shí)施例的第一方面,提供了一種殘留回聲抑制模型的訓(xùn)練方法,包括:
基于多個(gè)殘留回聲信號(hào)、多個(gè)背景噪音信號(hào)和多個(gè)近端語音信號(hào)生成多個(gè)混合音頻信號(hào),其中,每個(gè)混合音頻信號(hào)包括一個(gè)殘留回聲信號(hào)、一個(gè)背景噪音信號(hào)和一個(gè)近端語音信號(hào);
基于所述多個(gè)混合音頻信號(hào),確定與所述多個(gè)混合音頻信號(hào)對(duì)應(yīng)的多個(gè)輔助信號(hào),其中,基于每個(gè)混合音頻信號(hào)中的殘留回聲信號(hào)對(duì)應(yīng)的遠(yuǎn)端信號(hào),確定每個(gè)混合音頻信號(hào)對(duì)應(yīng)的輔助信號(hào);
基于所述多個(gè)混合音頻信號(hào)和所述多個(gè)輔助信號(hào)訓(xùn)練殘留回聲抑制模型。
根據(jù)本公開實(shí)施例的第二方面,提供了一種殘留回聲抑制模型的訓(xùn)練裝置,包括:
混合音頻信號(hào)生成模塊,用于基于多個(gè)殘留回聲信號(hào)、多個(gè)背景噪音信號(hào)和多個(gè)純凈的近端語音信號(hào)生成多個(gè)混合音頻信號(hào),其中,每個(gè)混合音頻信號(hào)包括一個(gè)殘留回聲信號(hào)、一個(gè)背景噪音信號(hào)和一個(gè)純凈的近端語音信號(hào);
輔助信號(hào)確定模塊,用于基于所述多個(gè)混合音頻信號(hào),確定與所述多個(gè)混合音頻信號(hào)對(duì)應(yīng)的多個(gè)輔助信號(hào),其中,基于每個(gè)混合音頻信號(hào)中的殘留回聲信號(hào)對(duì)應(yīng)的遠(yuǎn)端信號(hào),確定每個(gè)混合音頻信號(hào)對(duì)應(yīng)的輔助信號(hào);
模型訓(xùn)練模塊,用于基于所述多個(gè)混合音頻信號(hào)和多個(gè)輔助信號(hào)訓(xùn)練殘留回聲抑制模型。
根據(jù)本公開實(shí)施例的第三方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行上述第一方面所述的殘留回聲抑制模型的訓(xùn)練方法。
根據(jù)本公開實(shí)施例的第四方面,提供了一種電子設(shè)備,所述電子設(shè)備包括:
處理器;
用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
所述處理器,用于從所述存儲(chǔ)器中讀取所述可執(zhí)行指令,并執(zhí)行所述指令以實(shí)現(xiàn)上述第一方面所述的殘留回聲抑制模型的訓(xùn)練方法。
基于本公開上述實(shí)施例提供的殘留回聲抑制模型的訓(xùn)練方法和訓(xùn)練裝置,基于包括殘留回聲信號(hào)、背景噪音信號(hào)和純凈的近端語音信號(hào)的混合音頻信號(hào),以及輔助信號(hào)訓(xùn)練的殘留回聲抑制模型,可以對(duì)非線性的殘留回聲信號(hào)進(jìn)行有效抑制,進(jìn)而可以提升通話質(zhì)量,增強(qiáng)了用戶體驗(yàn)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京地平線信息技術(shù)有限公司,未經(jīng)北京地平線信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111017286.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。





