[發明專利]音頻處理方法、裝置、存儲介質及電子設備有效
| 申請號: | 202010074552.2 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN111326132B | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 鄭羲光;張晨 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10H1/36 | 分類號: | G10H1/36 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 寧立存 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 存儲 介質 電子設備 | ||
1.一種音頻處理方法,其特征在于,包括:
采集當前待處理樂曲的伴奏音頻信號和人聲信號;
確定采集到的伴奏音頻信號的目標混響強度參數值,所述目標混響強度參數值用于指示當前待處理樂曲的節奏速度、伴奏類型和演唱者的演唱評分;
其中,所述伴奏類型通過當前待處理樂曲的頻域豐富程度來表征,所述頻域豐富程度以頻域豐富系數進行數值化表示,當前待處理樂曲的伴奏越豐富,相應的頻域豐富程度越高,所述頻域豐富系數是基于伴奏音頻幀序列的幅度信息確定的,所述伴奏音頻幀序列是將所述伴奏音頻信號由時域變換到時頻域得到的;所述演唱者的演唱評分指代所述演唱者的歷史歌曲評分或實時歌曲評分;
基于所述目標混響強度參數值對采集到的人聲信號進行混響處理。
2.根據權利要求1所述的音頻處理方法,其特征在于,所述確定采集到的伴奏音頻信號的目標混響強度參數值,包括:
確定采集到的伴奏音頻信號的第一混響強度參數值,所述第一混響強度參數值用于指示當前待處理樂曲的伴奏類型;
確定采集到的伴奏音頻信號的第二混響強度參數值,所述第二混響強度參數值用于指示當前待處理樂曲的節奏速度;
確定采集到的伴奏音頻信號的第三混響強度參數值,所述第三混響強度參數值用于指示當前待處理樂曲的演唱者的演唱評分;
基于所述第一混響強度參數值、所述第二混響強度參數值和所述第三混響強度參數值,確定所述目標混響強度參數值。
3.根據權利要求2所述的音頻處理方法,其特征在于,所述確定采集到的伴奏音頻信號的第一混響強度參數值,包括:
獲取所述伴奏音頻幀序列中每幀伴奏音頻的幅度信息;
基于每幀伴奏音頻的幅度信息,確定每幀伴奏音頻的頻域豐富系數;
其中,所述頻域豐富系數用于指示每幀伴奏音頻的幅度信息的頻域豐富程度;
基于每幀伴奏音頻的頻域豐富系數確定所述第一混響強度參數值。
4.根據權利要求3所述的音頻處理方法,其特征在于,所述基于每幀伴奏音頻的頻域豐富系數確定所述第一混響強度參數值,包括:
基于每幀伴奏音頻的頻域豐富系數,確定當前待處理樂曲的全局頻域豐富系數;
獲取所述全局頻域豐富系數與頻域豐富系數最大值之間的第一比值,將所述第一比值和目標數值中的最小者確定為所述第一混響強度參數值。
5.根據權利要求3所述的音頻處理方法,其特征在于,所述基于每幀伴奏音頻的頻域豐富系數確定所述第一混響強度參數值,包括:
基于每幀伴奏音頻的頻域豐富系數,生成用于指示頻域豐富程度的波形圖;
對生成的波形圖進行平滑處理,基于平滑后的波形圖確定當前待處理樂曲的不同部分的頻域豐富系數;
獲取所述不同部分的頻域豐富系數分別與頻域豐富系數最大值之間的第二比值;
對于獲取到的每個第二比值,將所述第二比值和目標數值中的最小者確定為所述第一混響強度參數值。
6.根據權利要求2所述的音頻處理方法,其特征在于,所述確定采集到的伴奏音頻信號的第二混響強度參數值,包括:
獲取采集到的伴奏音頻信號在規定時長的節拍數;
確定獲取到的節拍數與節拍數最大值之間的第三比值;
將所述第三比值和目標數值中的最小者,確定為所述第二混響強度參數值。
7.根據權利要求2所述的音頻處理方法,其特征在于,所述確定采集到的伴奏音頻信號的第三混響強度參數值,包括:
獲取當前待處理樂曲的演唱者的音頻演唱分值,基于所述音頻演唱分值確定所述第三混響強度參數值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010074552.2/1.html,轉載請聲明來源鉆瓜專利網。





