[發明專利]聲音場景的識別方法、裝置、設備及存儲介質在審
| 申請號: | 202010787183.1 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN112750448A | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 李娟娟;夏咸軍;朱鴻寧;王燕南;黃俊 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/12;G10L25/18;G10L25/24;G10L25/30;G10L25/45 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 張所明 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲音 場景 識別 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種聲音場景的識別方法、裝置、設備及存儲介質,涉及音頻技術領域。該方法包括:獲取音頻信號;對音頻信號進行特征提取,得到音頻特征;根據音頻特征對音頻信號進行至少兩級場景識別,得到至少兩級場景識別結果,場景識別結果中包含不同場景類別對應的場景概率;基于至少兩級場景識別結果,確定音頻信號對應的目標場景類別;其中,不同級別場景識別結果中包含的場景類別不同,且對于第i級場景識別結果中的任意場景類別,第i+1級場景識別結果中存在與場景類別對應的父類場景類別。采用本申請實施例提供的方案有助于提高聲音場景的識別準確率。
技術領域
本申請實施例涉及音頻技術領域,特別涉及一種聲音場景的識別方法、裝置、設備及存儲介質。
背景技術
聲音場景識別作為音頻技術領域的一個重要分支,被廣泛應用于音視頻通話、降噪優化等場景。
相關技術中,主要從音頻信號處理和機器學習兩個方面來提高聲音場景識別的準確性。其中,音頻信號處理的重點在于提高音頻信號的聲學特征提取質量,以此提高后續基于聲學特征進行聲音場景識別的準確性,而機器學習的重點在于利用大量音頻信號樣本訓練高質量音頻識別模型,以此提高模型基于音頻信號進行聲音場景識別的準確性。
然而,采用相關技術提供的方案進行聲音場景識別時,都是基于單一維度對音頻信號進行場景識別,場景識別的準確率無法得到進一步提高。
發明內容
本申請實施例提供了一種聲音場景的識別方法、裝置、設備及存儲介質,可以提高對音頻信號進行聲音場景識別時的準確率。所述技術方案如下:
一方面,本申請實施例提供了一種聲音場景的識別方法,所述方法包括:
獲取音頻信號;
對所述音頻信號進行特征提取,得到音頻特征;
根據所述音頻特征對所述音頻信號進行至少兩級場景識別,得到至少兩級場景識別結果,所述場景識別結果中包含不同場景類別對應的場景概率;
基于至少兩級所述場景識別結果,確定所述音頻信號對應的目標場景類別;
其中,不同級別場景識別結果中包含的場景類別不同,且對于第i級場景識別結果中的任意場景類別,第i+1級場景識別結果中存在與所述場景類別對應的父類場景類別,i為正整數。
另一方面,本申請實施例提供了一種聲音場景的識別裝置,所述裝置包括:
獲取模塊,用于獲取音頻信號;
特征提取模塊,用于對所述音頻信號進行特征提取,得到音頻特征;
場景識別模塊,用于根據所述音頻特征對所述音頻信號進行至少兩級場景識別,得到至少兩級場景識別結果,所述場景識別結果中包含不同場景類別對應的場景概率;
第一場景確定模塊,用于基于至少兩級所述場景識別結果,確定所述音頻信號對應的目標場景類別;
其中,不同級別場景識別結果中包含的場景類別不同,且對于第i級場景識別結果中的任意場景類別,第i+1級場景識別結果中存在與所述場景類別對應的父類場景類別,i為正整數。
另一方面,本申請實施例提供了一種計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由所述處理器加載并執行以實現如上述方面所述的聲音場景的識別方法。
另一方面,提供了一種計算機可讀存儲介質,所述可讀存儲介質中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或指令集由處理器加載并執行以實現如上述方面所述的聲音場景的識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010787183.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻處理方法、裝置及設備
- 下一篇:時鐘門控單元及集成電路





