[發明專利]音頻處理的方法和裝置有效

申請號：	201811066716.6	申請日：	2018-09-13
公開（公告）號：	CN109192218B	公開（公告）日：	2021-05-07
發明（設計）人：	勞振鋒	申請（專利權）人：	廣州酷狗計算機科技有限公司
主分類號：	G10L21/003	分類號：	G10L21/003;G10L25/03;G10L25/18
代理公司：	北京三高永信知識產權代理有限責任公司 11138	代理人：	郭晶
地址：	510660 廣東省廣州***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種音頻處理的方法和裝置，屬于音頻編輯技術領域。所述方法包括：在目標音頻中獲取音色參考音頻幀，提取所述音色參考音頻幀的頻譜包絡特征信息；提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息；基于所述基頻信息和所述頻譜包絡特征信息，生成所述源音頻幀對應的變音色音頻幀。采用本發明，可以有效解決變聲過程中音調改變的技術問題。

技術領域

本發明涉及音頻編輯技術領域，特別涉及一種音頻處理的方法和裝置。

背景技術

現在，很多手機上都有變聲軟件，對人聲進行男女聲或者童聲大叔聲的轉換，對于用戶來說是一件很有趣味的事情。

相關技術中變聲的原理為：將源音頻每隔幾音頻幀復制一音頻幀，然后將復制的音頻幀插入到被復制的音頻幀后邊，得到時長變長的降速音頻。對降速音頻進行重采樣得到時長與源音頻相同的新音頻。新音頻的音調和音色都發生了改變，從而達到了變聲的目的。

在實現本發明的過程中，發明人發現相關技術至少存在以下問題：

當想要將變調后的人聲音頻與伴奏音頻合成歌曲音頻時，有以下兩種情況：如果伴奏音頻相應的變調，由于伴奏音頻的音調改變，伴奏音頻的音質就會受損，最后合成的歌曲音頻的質量就會下降；如果伴奏音頻不變調，那么變調后的人聲音頻和不變調的伴奏音頻不在一個音調上，合成的歌曲音頻聽覺效果差。

發明內容

為了解決相關技術中存在的問題，本發明實施例提供了一種音頻處理的方法和裝置。所述技術方案如下：

第一方面，提供了一種音頻處理的方法，所述方法包括：

在目標音頻中獲取音色參考音頻幀，提取所述音色參考音頻幀的頻譜包絡特征信息；

提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息；

基于所述基頻信息和所述頻譜包絡特征信息，生成所述源音頻幀對應的變音色音頻幀。

可選的，所述方法還包括：

提取所述源音頻幀的輔音信息；

所述基于所述基頻信息和所述頻譜包絡特征信息，生成所述源音頻幀對應的變音色音頻幀，包括：

基于所述基頻信息、所述頻譜包絡特征信息和所述輔音信息，生成所述源音頻幀對應的變音色音頻幀。

可選的，所述在目標音頻中獲取音色參考音頻幀之前，還包括：

對所述源音頻進行變調處理得到所述目標音頻。

可選的，所述對所述源音頻進行變調處理得到所述目標音頻，包括：

在所述源音頻中，每間隔第一預設數目的源音頻幀，選取第二預設數目的源音頻幀，復制所述第二預設數目的源音頻幀，將復制的源音頻幀，插入到選取的源音頻幀之后，得到所述源音頻對應的降速音頻；

對所述降速音頻進行重采樣，得到與所述源音頻的幀數目相同且時長相同的所述目標音頻。

可選的，所述在目標音頻中獲取音色參考音頻幀之前，還包括：

顯示本地音頻列表；

當接收到對所述本地音頻列表中的所述目標音頻的選項的選取指令時，獲取所述目標音頻。

第二方面，提供了一種音頻處理的裝置，所述裝置包括：

獲取模塊，用于在目標音頻中獲取音色參考音頻幀；

提取模塊，用于提取所述音色參考音頻幀的頻譜包絡特征信息和提取源音頻中與所述音色參考音頻幀的播放時間點相同的源音頻幀的基頻信息；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司，未經廣州酷狗計算機科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811066716.6/2.html，轉載請聲明來源鉆瓜專利網。

上一篇：面向多類低速率壓縮語音隱寫的通用信息隱藏檢測方法
下一篇：基于關鍵詞改進麥克風陣列遠場拾音的方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質量或其可識度而處理語音信號，以產生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】