[發明專利]音頻處理的方法和裝置有效
| 申請號: | 201811066716.6 | 申請日: | 2018-09-13 |
| 公開(公告)號: | CN109192218B | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 勞振鋒 | 申請(專利權)人: | 廣州酷狗計算機科技有限公司 |
| 主分類號: | G10L21/003 | 分類號: | G10L21/003;G10L25/03;G10L25/18 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 郭晶 |
| 地址: | 510660 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 | ||
本發明公開了一種音頻處理的方法和裝置,屬于音頻編輯技術領域。所述方法包括:在目標音頻中獲取音色參考音頻幀,提取所述音色參考音頻幀的頻譜包絡特征信息;提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息;基于所述基頻信息和所述頻譜包絡特征信息,生成所述源音頻幀對應的變音色音頻幀。采用本發明,可以有效解決變聲過程中音調改變的技術問題。
技術領域
本發明涉及音頻編輯技術領域,特別涉及一種音頻處理的方法和裝置。
背景技術
現在,很多手機上都有變聲軟件,對人聲進行男女聲或者童聲大叔聲的轉換,對于用戶來說是一件很有趣味的事情。
相關技術中變聲的原理為:將源音頻每隔幾音頻幀復制一音頻幀,然后將復制的音頻幀插入到被復制的音頻幀后邊,得到時長變長的降速音頻。對降速音頻進行重采樣得到時長與源音頻相同的新音頻。新音頻的音調和音色都發生了改變,從而達到了變聲的目的。
在實現本發明的過程中,發明人發現相關技術至少存在以下問題:
當想要將變調后的人聲音頻與伴奏音頻合成歌曲音頻時,有以下兩種情況:如果伴奏音頻相應的變調,由于伴奏音頻的音調改變,伴奏音頻的音質就會受損,最后合成的歌曲音頻的質量就會下降;如果伴奏音頻不變調,那么變調后的人聲音頻和不變調的伴奏音頻不在一個音調上,合成的歌曲音頻聽覺效果差。
發明內容
為了解決相關技術中存在的問題,本發明實施例提供了一種音頻處理的方法和裝置。所述技術方案如下:
第一方面,提供了一種音頻處理的方法,所述方法包括:
在目標音頻中獲取音色參考音頻幀,提取所述音色參考音頻幀的頻譜包絡特征信息;
提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息;
基于所述基頻信息和所述頻譜包絡特征信息,生成所述源音頻幀對應的變音色音頻幀。
可選的,所述方法還包括:
提取所述源音頻幀的輔音信息;
所述基于所述基頻信息和所述頻譜包絡特征信息,生成所述源音頻幀對應的變音色音頻幀,包括:
基于所述基頻信息、所述頻譜包絡特征信息和所述輔音信息,生成所述源音頻幀對應的變音色音頻幀。
可選的,所述在目標音頻中獲取音色參考音頻幀之前,還包括:
對所述源音頻進行變調處理得到所述目標音頻。
可選的,所述對所述源音頻進行變調處理得到所述目標音頻,包括:
在所述源音頻中,每間隔第一預設數目的源音頻幀,選取第二預設數目的源音頻幀,復制所述第二預設數目的源音頻幀,將復制的源音頻幀,插入到選取的源音頻幀之后,得到所述源音頻對應的降速音頻;
對所述降速音頻進行重采樣,得到與所述源音頻的幀數目相同且時長相同的所述目標音頻。
可選的,所述在目標音頻中獲取音色參考音頻幀之前,還包括:
顯示本地音頻列表;
當接收到對所述本地音頻列表中的所述目標音頻的選項的選取指令時,獲取所述目標音頻。
第二方面,提供了一種音頻處理的裝置,所述裝置包括:
獲取模塊,用于在目標音頻中獲取音色參考音頻幀;
提取模塊,用于提取所述音色參考音頻幀的頻譜包絡特征信息和提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司,未經廣州酷狗計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811066716.6/2.html,轉載請聲明來源鉆瓜專利網。





