[發明專利]場景識別方法、裝置、電子設備以及計算機可讀存儲介質有效
| 申請號: | 202010898855.6 | 申請日: | 2020-08-31 |
| 公開(公告)號: | CN112053700B | 公開(公告)日: | 2023-02-07 |
| 發明(設計)人: | 黃景標;林聚財 | 申請(專利權)人: | 浙江大華技術股份有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/51;G10L25/78;G06F17/10 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 黎堅怡 |
| 地址: | 310051 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 場景 識別 方法 裝置 電子設備 以及 計算機 可讀 存儲 介質 | ||
本申請公開了一種場景識別方法、裝置、電子設備以及計算機可讀存儲介質,該場景識別方法包括:獲取語音通信過程中的音頻信號以及參考回聲信號;分別計算音頻信號的功率以及參考回聲信號的功率;基于音頻信號的功率以及參考回聲信號的功率,計算音頻信號的對數似然比;將對數似然比分別與第一預設閾值和第二預設閾值進行比較,其中,第一預設閾值小于第二預設閾值;在對數似然比大于第一預設閾值,且小于第二預設閾值的情況下,確定場景為回聲突變場景。上述方案,能夠通過引入對數似然比提高識別回聲突變場景的準確性。
技術領域
本申請涉及音頻處理應用技術領域,特別是涉及一種場景識別方法、裝置、電子設備以及計算機可讀存儲介質。
背景技術
在現實生活中,當用戶使用手機開啟免提電話或者視頻會議終端進行視頻會議時,由于揚聲器的外放會導致揚聲器播放的聲音再次被麥克風采集到,從而導致回聲問題。
回聲問題會嚴重影響通話質量以降低語音通話中的交流與合作,通常來說,一般會使用回聲消除算法來解決回聲問題。使用回聲消除算法之前,需要準確檢測出回聲場景。然而,目前的場景識別方案只能區分雙端講話和遠端單講場景,無法準確識別出回聲場景,導致無法很好地解決語音通話中的回聲問題。
發明內容
本申請至少提供一種場景識別方法、裝置、電子設備以及計算機可讀存儲介質。
本申請第一方面提供了一種場景識別方法,所述場景識別方法包括:
獲取語音通信過程中的音頻信號以及參考回聲信號;
分別計算所述音頻信號的功率以及所述參考回聲信號的功率;
基于所述音頻信號的功率以及所述參考回聲信號的功率,計算所述音頻信號的對數似然比;
將所述對數似然比分別與第一預設閾值和第二預設閾值進行比較,其中,所述第一預設閾值小于所述第二預設閾值;
在所述對數似然比大于所述第一預設閾值,且小于所述第二預設閾值的情況下,確認所述場景為回聲突變場景。
其中,所述場景識別方法還包括:
在所述對數似然比小于所述第一預設閾值的情況下,確認所述場景為雙講場景;
在所述對數似然比大于所述第二預設閾值的情況下,確認所述場景為遠端說話場景。
其中,所述場景識別方法還包括:
獲取所述參考回聲信號的幅值;
基于預設的遺忘因子以及所述參考回聲信號的幅值計算每一幀參考回聲信號的功率。
其中,所述音頻信號至少包括背景噪聲,所述場景識別方法還包括:
獲取所述音頻信號的幅值;
通過將不同幀所述音頻信號的幅值作差,獲取所述背景噪聲的功率。
其中,所述音頻信號還包括第一估計回聲信號,所述場景識別方法還包括:
采用自適應濾波器獲取所述第一估計回聲信號的幅值;
通過將不同幀所述第一估計回聲信號的幅值作差,獲取所述第一估計回聲信號的功率。
其中,所述音頻信號還包括第二估計回聲信號,所述場景識別方法還包括:
通過將所述音頻信號的功率與所述第一估計回聲信號的功率作差,獲得殘余回聲信號的功率;
基于所述參考回聲的功率、所述殘余回聲信號的功率以及所述音頻信號的功率計算所述第二估計回聲信號的功率。
其中,所述音頻信號還包括近端語音信號,所述場景識別方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大華技術股份有限公司,未經浙江大華技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010898855.6/2.html,轉載請聲明來源鉆瓜專利網。





