[發明專利]音頻處理方法、裝置及存儲介質有效
| 申請號: | 201811404900.7 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN109346044B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 萬景軒;肖純智 | 申請(專利權)人: | 廣州酷狗計算機科技有限公司 |
| 主分類號: | G10H1/00 | 分類號: | G10H1/00;G10H1/40 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 鞠永善 |
| 地址: | 510660 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 存儲 介質 | ||
本發明公開了一種音頻處理方法、裝置及存儲介質,屬于多媒體技術領域。所述方法包括:確定待混音的音頻的結構特征,結構特征用于指示音頻包括的多個不同性質的第一音頻片段,從音頻素材庫中,獲取屬于預設混音風格的目標音頻素材,以及目標音頻素材對應的片段性質和混音信息;基于結構特征、目標音頻素材對應的片段性質和混音信息,從多個第一音頻片段中確定目標音頻素材對應的音頻子片段;將目標音頻素材與音頻子片段進行混音處理。本發明在不改變音頻的結構的基礎上,將目標音頻素材混入原始的音頻中,得到另一種版本的音頻,保證了播放器播放混音處理后的音頻時顯示的歌詞與實際播放的音頻能夠匹配。
技術領域
本發明涉及多媒體技術領域,特別涉及一種音頻處理方法、裝置及存儲介質。
背景技術
隨著多媒體技術的快速發展,混音逐漸成為一種主流。混音是指通過改變音頻的強弱、音高、音速、曲調長度以及其他各方面構成音頻要素的方式,使得音頻成為另一種版本,從而為用戶提供新鮮的體驗。
在相關技術中,混音的處理過程一般可以包括:從音頻中提取人聲,并選取部分片段,譬如,選取主歌、副歌等片段,然后對選取的片段重新進行排序,為排序后的人聲添加一個新的伴奏,從而達到混音的目的。
然而,在上述實現方式中,由于對選取的片段重新進行排序,改變了音頻原本的結構,從而導致播放器播放混音后的音頻時,顯示的歌詞與實際播放的音頻可能不匹配。
發明內容
本發明實施例提供了一種音頻處理方法、裝置及存儲介質,可以解決相關技術導致播放器播放混音后的音頻時顯示的歌詞與實際播放的音頻可能不匹配的問題。所述技術方案如下:
第一方面,提供了一種音頻處理方法,所述方法包括:
確定待混音的音頻的結構特征,所述結構特征用于指示所述音頻包括的多個不同性質的第一音頻片段;
從音頻素材庫中,獲取屬于預設混音風格的目標音頻素材,以及所述目標音頻素材對應的片段性質和混音信息;
基于所述結構特征、所述目標音頻素材對應的片段性質和混音信息,從多個第一音頻片段中確定所述目標音頻素材對應的音頻子片段;
將所述目標音頻素材與所述音頻子片段進行混音處理。
可選地,所述基于所述結構特征、所述目標音頻素材對應的片段性質和混音信息,從多個第一音頻片段中確定所述目標音頻素材對應的音頻子片段,包括:
基于所述結構特征,從所述多個第一音頻片段中確定性質為所述目標音頻素材對應的片段性質的第二音頻片段;
基于所述混音信息,確定混音長度,以及從所述第二音頻片段中確定混音起始位置;
將所述第二音頻片段中從所述混音起始位置開始的所述混音長度的音頻子片段確定為所述目標音頻素材對應的音頻子片段。
可選地,所述將所述目標音頻素材與所述音頻子片段進行混音處理,包括:
確定所述第二音頻片段包括的節拍數量;
基于所述混音信息和所述第二音頻片段包括的節拍數量,對所述目標音頻素材進行循環拼接,得到混音素材;
將所述混音素材與所述音頻子片段進行混音處理。
可選地,基于所述混音信息和所述第二音頻片段包括的節拍數量,對所述目標音頻素材進行循環拼接,包括:
當所述混音信息還包括預設節拍數量時,如果所述第二音頻片段包括的節拍數量與所述片段節拍數量呈倍數關系,則將所述目標音頻素材循環拼接成所述混音長度個節拍。
可選地,所述將所述混音素材與所述音頻子片段進行混音處理之前,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司,未經廣州酷狗計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811404900.7/2.html,轉載請聲明來源鉆瓜專利網。





