[發(fā)明專利]基于人工智能的音頻處理方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011410814.4 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN113539283A | 公開(公告)日: | 2021-10-22 |
| 發(fā)明(設(shè)計)人: | 吳雯;夏咸軍 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/03;G10L25/30;G10L25/51 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司 11270 | 代理人: | 高天華;張穎玲 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 人工智能 音頻 處理 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
1.一種基于人工智能的音頻處理方法,其特征在于,所述方法包括:
獲取音頻場景的音頻片段,其中,所述音頻片段中包括噪聲;
基于所述音頻片段執(zhí)行音頻場景分類處理,以得到與所述音頻片段中的噪聲對應的音頻場景類型;
確定與所述音頻場景類型匹配的目標音頻處理模式,并對所述音頻場景的音頻片段應用所述目標音頻處理模式。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述目標音頻處理模式包括降噪處理模式;
所述確定與所述音頻場景類型匹配的目標音頻處理模式,包括:
基于所述音頻場景對應的音頻場景類型,查詢不同音頻場景類型與候選降噪處理模式的對應關(guān)系,將查詢到的候選降噪處理模式作為與所述音頻場景類型匹配的降噪處理模式,或者
基于所述音頻場景對應的音頻場景類型,確定與所述音頻場景類型匹配的噪聲;基于所述與所述音頻場景類型匹配的噪聲,查詢不同噪聲與所述候選降噪處理模式的對應關(guān)系,將查詢到的候選降噪處理模式作為與所述音頻場景類型匹配的降噪處理模式;
其中,不同的所述音頻場景所包括的噪聲的類型不完全相同。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述音頻場景的音頻片段應用所述目標音頻處理模式之前,所述方法還包括:
檢測所述音頻片段中的噪聲所帶來的干擾度;
當檢測到的所述干擾度大于干擾度閾值時,確定將對所述音頻場景的音頻片段應用與所述音頻場景類型匹配的降噪處理模式。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述音頻場景的音頻片段應用所述目標音頻處理模式,包括:
基于所述音頻場景類型所包括的噪聲類型,對所述音頻片段中的噪聲進行匹配,將匹配到的噪聲進行抑制處理,以使所述音頻片段的語音信號強度與噪聲信號強度的比值低于信噪比閾值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述目標音頻處理模式包括碼率切換處理模式;
所述確定與所述音頻場景類型匹配的目標音頻處理模式,包括:
基于所述音頻場景對應的音頻場景類型,查詢不同音頻場景類型與候選碼率切換處理模式的對應關(guān)系,將查詢到的候選碼率切換處理模式作為與所述音頻場景類型匹配的碼率切換處理模式;或者
將所述音頻場景類型與需要進行碼率切換的預設(shè)音頻場景類型比對;當比對確定所述音頻場景類型屬于需要進行碼率切換的預設(shè)音頻場景類型時,將與所述預設(shè)音頻場景類型關(guān)聯(lián)的碼率切換處理模式,確定為與所述音頻場景類型匹配的碼率切換處理模式。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述音頻場景的音頻片段應用所述目標音頻處理模式,包括:
獲取所述音頻場景的通信信號強度;
當所述音頻場景的通信信號強度小于通信信號強度閾值時,按照預設(shè)比例或預設(shè)值降低所述音頻片段的音頻碼率;
當所述音頻場景的通信信號強度大于或者等于所述通信信號強度閾值時,按照預設(shè)比例或預設(shè)值提升所述音頻片段的音頻碼率。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述音頻場景的音頻片段應用所述目標音頻處理模式,包括:
基于在所述音頻場景中多次采樣得到的通信信號強度,確定所述音頻場景中的通信信號強度的抖動變化情況;
當所述抖動變化情況表征所述通信信號呈現(xiàn)不穩(wěn)定的狀態(tài)時,按照預設(shè)比例或預設(shè)值降低所述音頻片段的音頻碼率。
8.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述對所述音頻場景的音頻片段應用所述目標音頻處理模式,包括:
當用于傳輸所述音頻片段的通信網(wǎng)絡的類型屬于設(shè)定類型時,按照預設(shè)比例或預設(shè)值降低所述音頻片段的音頻碼率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011410814.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





