[發(fā)明專利]音頻處理方法、裝置、電子設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202110107918.6 | 申請日: | 2021-01-27 |
| 公開(公告)號: | CN112951265B | 公開(公告)日: | 2022-07-19 |
| 發(fā)明(設(shè)計(jì))人: | 熊貝爾;朱一聞;曹偲;鄭博;劉華平 | 申請(專利權(quán))人: | 杭州網(wǎng)易云音樂科技有限公司 |
| 主分類號: | G10L21/0316 | 分類號: | G10L21/0316;G10L21/0324;G10H1/46 |
| 代理公司: | 北京同達(dá)信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 張愷寧 |
| 地址: | 310052 浙江省杭州市蕭山區(qū)錢江世*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 音頻 處理 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請?zhí)峁┮环N音頻處理方法、裝置、電子設(shè)備和存儲介質(zhì),該方法包括:獲取干音音頻中目標(biāo)時(shí)間段的目標(biāo)干音音頻;根據(jù)該目標(biāo)干音音頻的全局能量特征和該目標(biāo)干音音頻對應(yīng)的目標(biāo)伴奏音頻的全局掩蔽特征,確定伴奏音頻對干音音頻的目標(biāo)掩蔽能力度量值;基于預(yù)先設(shè)置的伴奏對干音的掩蔽能力度量值與伴奏干音音量比的對應(yīng)關(guān)系,確定上述目標(biāo)掩蔽能力度量值對應(yīng)的目標(biāo)伴奏干音音量比,將伴奏音頻與干音音頻的音量比調(diào)節(jié)至目標(biāo)伴奏干音音量比。本申請可以得到適合音樂作品的伴奏音頻與干音音頻的音量比,并將伴奏音頻的音量與干音音頻的音量調(diào)節(jié)至該音量比,節(jié)省用戶的調(diào)音時(shí)間,調(diào)音過程簡單并且調(diào)音效果好。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地說,涉及一種音頻處理方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
一些唱歌軟件的使用給用戶的生活帶來了許多樂趣。用戶可以通過這些唱歌軟件錄制歌曲,生產(chǎn)自己的音樂作品,這一般分為三個(gè)過程:人聲錄制過程、回放調(diào)音過程、伴奏人聲混音過程。在回放調(diào)音過程,可以在回放調(diào)音界面顯示人聲音量和伴奏音量,并且伴奏音量和人聲音量的比例為預(yù)先設(shè)置的固定比例。
但是,上述伴奏音量和人聲音量的固定比例,并不適用于所有音樂作品,通常需要用戶自行調(diào)節(jié)伴奏音量和人聲音量的比例,調(diào)音過程比較繁瑣,并且用戶自行調(diào)音的效果不好。
發(fā)明內(nèi)容
本申請實(shí)施例提供一種音頻處理方法、裝置、電子設(shè)備和存儲介質(zhì),用以為用戶推薦合適的伴奏音頻和人聲音頻的音量比,節(jié)省用戶的調(diào)音時(shí)間,調(diào)音過程簡單并且調(diào)音效果好。
一方面,本申請實(shí)施例提供一種音頻處理方法,包括:
獲取干音音頻中目標(biāo)時(shí)間段的目標(biāo)干音音頻;
根據(jù)所述目標(biāo)干音音頻的全局能量特征和所述目標(biāo)干音音頻對應(yīng)的目標(biāo)伴奏音頻的全局掩蔽特征,確定所述干音音頻對應(yīng)的伴奏音頻對所述干音音頻的目標(biāo)掩蔽能力度量值;
根據(jù)預(yù)先設(shè)置的伴奏對干音的掩蔽能力度量值與伴奏干音音量比的對應(yīng)關(guān)系,確定所述目標(biāo)掩蔽能力度量值對應(yīng)的目標(biāo)伴奏干音音量比;
將所述伴奏音頻與所述干音音頻的音量比調(diào)節(jié)至所述目標(biāo)伴奏干音音量比。
在一種可選的實(shí)施方式中,所述獲取干音音頻中的目標(biāo)時(shí)間段的目標(biāo)干音音頻,包括:
獲取所述干音音頻的各幀音頻的均方根能量數(shù)據(jù);
確定所述干音音頻中設(shè)定時(shí)間段內(nèi)的均方根能量數(shù)據(jù)的和最大的時(shí)間段,將確定的時(shí)間段的干音音頻作為所述目標(biāo)干音音頻。
在一種可選的實(shí)施方式中,所述獲取所述干音音頻的各幀音頻的均方根能量數(shù)據(jù)之后,確定所述干音音頻中設(shè)定時(shí)間段內(nèi)的均方根能量數(shù)據(jù)的和最大的時(shí)間段之前,還包括:
從獲取的均方根能量數(shù)據(jù)中,去除所述干音音頻的第一靜音區(qū)域的均方根能量數(shù)據(jù)。
在一種可選的實(shí)施方式中,所述方法還包括:
對于所述目標(biāo)干音音頻的每幀音頻,將所述每幀音頻的各頻帶的能量特征求和,得到所述每幀音頻的能量特征;
將所述目標(biāo)干音音頻的各幀音頻的能量特征的和作為所述全局能量特征。
在一種可選的實(shí)施方式中,所述方法還包括:
從預(yù)先獲取的所述伴奏音頻的各幀音頻的掩蔽特征中,獲取所述目標(biāo)時(shí)間段的伴奏音頻的各幀音頻的掩蔽特征;
將所述各幀音頻的掩蔽特征的和作為所述目標(biāo)伴奏音頻的全局掩蔽特征。
在一種可選的實(shí)施方式中,所述獲取所述目標(biāo)時(shí)間段的伴奏音頻的各幀音頻的掩蔽特征之后,將所述各幀音頻的掩蔽特征的和作為所述目標(biāo)伴奏音頻的全局掩蔽特征之前,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州網(wǎng)易云音樂科技有限公司,未經(jīng)杭州網(wǎng)易云音樂科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110107918.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





