[發明專利]音頻處理方法、裝置、計算設備及介質在審
| 申請號: | 202210524704.3 | 申請日: | 2022-05-13 |
| 公開(公告)號: | CN115019814A | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 熊貝爾;曹偲;高月潔;吳迪;鄭博;李鵬;劉華平 | 申請(專利權)人: | 杭州網易云音樂科技有限公司 |
| 主分類號: | G10L21/003 | 分類號: | G10L21/003 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 董曉盈 |
| 地址: | 310052 浙江省杭州市蕭山區錢江世*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 計算 設備 介質 | ||
本公開的實施方式提供了一種音頻處理方法、裝置、計算設備及介質。本公開通過在獲取到待處理音頻后,確定候選音頻組中每個候選音頻與待處理音頻之間的音色相似度,其中,候選音頻組所包括的音頻兩兩之間的相似度之和,是每個音頻組所包括的音頻兩兩之間的相似度之和中最小的,從而使得候選音頻組所包括的候選音頻的音色更加多樣,從而使得可以從更加多樣的候選音頻中實現目標音頻的確定,以提高所確定出的目標音頻的準確性,進而基于目標音頻的預設調音參數,對待處理音頻進行調音處理,實現對待處理音頻的自動調音過程,無需相關技術人員手動操作,從而可以提高音頻處理過程的調音效率。
技術領域
本公開的實施方式涉及音頻處理技術領域,更具體地,本公開的實施方式涉及一種音頻處理方法、裝置、計算設備及介質。
背景技術
本部分旨在為本公開的實施方式提供背景或上下文。此處的描述不因為包括在本部分中就承認是現有技術。
調音是一種通過后期制作調整使音頻更自然、更符合需要的音樂制作方式。
相關技術中,主要是由專業的調音師通過調音臺來對音頻進行調音,對調音師的專業要求極高,而且需要調音師手動操作,從而導致音頻調音效率較低。
發明內容
在本上下文中,本公開的實施方式期望提供一種音頻處理方法、裝置、計算設備及介質,以提高音頻處理過程的調音效率。
在本公開實施方式的第一方面中,提供了一種音頻處理方法,該方法包括:
獲取待處理音頻;
確定候選音頻組中每個候選音頻與待處理音頻之間的音色相似度,候選音頻組為從多個音頻組中確定出的一個音頻組,候選音頻組所對應的音色相似度之和在各個音頻組所對應的音色相似度之和中最小,音色相似度之和為音頻組所包括的音頻兩兩之間的相似度的和,每個候選音頻對應有預設調音參數;
基于待處理音頻與各個候選音頻的音色相似度,從多個候選音頻中確定目標音頻;
基于目標音頻的預設調音參數,對待處理音頻進行調音處理。
在本公開的一個實施例中,確定候選音頻組中每個候選音頻與待處理音頻之間的音色相似度,包括:
獲取各個候選音頻的音色特征以及待處理音頻的音色特征;
對于任一候選音頻,基于候選音頻的音色特征與待處理音頻的音色特征,確定候選音頻與待處理音頻之間的音色相似度。
在本公開的一個實施例中,獲取各個候選音頻的音頻音色以及待處理音頻的音色特征,包括:
對于任一音頻,確定音頻的人聲部分;
從音頻的人聲部分中,抽取目標數量的音頻幀;
基于目標數量的音頻幀的音色特征,確定音頻的音色特征。
在本公開的一個實施例中,從音頻的人聲部分中,抽取目標數量的音頻幀,包括:
基于音頻的人聲部分的時長,確定采樣頻率;
按照采樣頻率,在音頻的人聲部分中進行音頻幀抽取,得到目標數量的音頻幀。
在本公開的一個實施例中,基于目標數量的音頻幀的音色特征,確定音頻的音色特征,包括:
獲取各個音頻幀的音色特征,得到目標數量的音色特征;
基于目標數量的音色特征進行取平均處理,得到音頻的音色特征。
在本公開的一個實施例中,對于任一候選音頻,基于候選音頻的音色特征與待處理音頻的音色特征,確定候選音頻與待處理音頻之間的音色相似度,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州網易云音樂科技有限公司,未經杭州網易云音樂科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210524704.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種投料控制方法及裝置
- 下一篇:流量分配方法、裝置、電子設備及存儲介質





