[發(fā)明專利]一種語音信號處理方法、裝置、存儲介質及終端設備在審

申請?zhí)枺?/td>	202010932228.X	申請日：	2020-09-07
公開（公告）號：	CN112185403A	公開（公告）日：	2021-01-05
發(fā)明（設計）人：	徐波	申請（專利權）人：	廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司
主分類號：	G10L21/007	分類號：	G10L21/007;G10L21/013;G10L13/033;G10L19/16
代理公司：	廣州三環(huán)專利商標代理有限公司 44202	代理人：	麥小嬋;郝傳鑫
地址：	510000 廣***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音信號處理方法裝置存儲介質終端設備
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音信號處理方法，其特征在于，包括：

獲取語音片段中的N個語音特征；其中，N＞0；

對N個語音特征進行預設的不可逆變換處理，獲得N個第一語音特征；

將N個第一語音特征劃分為K個語音特征塊；其中，語音特征塊包含若干個第一語音特征，N≥K＞0；

分別對每一個語音特征塊中的第一語音特征進行調(diào)整處理，獲得N個第二語音特征；其中，所述調(diào)整處理為從第k個語音特征塊中截取部分第一語音特征，或者根據(jù)第k個語音特征塊中的第一語音特征填充新的語音特征；其中，K≥k＞0；

將N個第二語音特征輸入至預設的聲碼器中，合成變聲后的語音信號。

2.如權利要求1所述的語音信號處理方法，其特征在于，任一語音特征包括基音頻率、共振峰頻譜包絡、非周期激勵信號；則，所述獲取語音片段中的N個語音特征，具體包括：

按照預設的幀長度對所述語音片段進行分幀，獲得N個幀信號；

基于DIO算法提取每一個幀信號中的基音頻率，獲得N個基音頻率；

基于CheapTrick算法提取每一個幀信號中的共振峰頻譜包絡，獲得N個共振峰頻譜包絡；

基于PLATINUM算法提取每一個幀信號中的非周期激勵信號，獲得N個非周期激勵信號。

3.如權利要求2所述的語音信號處理方法，其特征在于，每一個第一語音特征包括第一基音頻率、第一共振峰頻譜包絡、第一非周期激勵信號，則，所述對N個語音特征進行預設的不可逆變換處理，獲得N個第一語音特征，具體包括：

對每一個基音頻率進行平滑處理、非線性處理和調(diào)頻處理，得到N個第一基音頻率；

對每一個共振峰頻譜包絡進行移動處理和平滑處理，得到N個第一共振峰頻譜包絡；

對每一個非周期激勵信號進行平滑處理和非線性處理，得到N個第一非周期激勵信號。

4.如權利要求3所述的語音信號處理方法，其特征在于，所述對每一個基音頻率進行平滑處理、非線性處理和調(diào)頻處理，得到N個第一基音頻率，具體包括：

將每一個基音頻率與該基音頻率相鄰的基音頻率進行均值計算，得到N個平滑處理后的基音頻率；

基于三角函數(shù)算法或指數(shù)函數(shù)算法，對每一個平滑處理后的基音頻率進行非線性處理，獲得N個非線性處理后的基音頻率；

以預設的頻率范圍為參考，將每一個非線性處理后的基音頻率映射到所述頻率范圍內(nèi)，得到N個第一基音頻率。

5.如權利要求3所述的語音信號處理方法，其特征在于，所述對每一個共振峰頻譜包絡進行移動處理和平滑處理，得到N個第一共振峰頻譜包絡，具體包括：

將每一個共振峰頻譜包絡循環(huán)移動N個單位，獲得N個移動處理后的共振峰頻譜包絡；

對每一個移動處理后的共振峰頻譜包絡與該移動處理后的共振峰頻譜包絡相鄰的移動處理后的共振峰頻譜包絡進行均值計算，得到N個第一共振峰頻譜包絡。

6.如權利要求3所述的語音信號處理方法，其特征在于，所述對每一個非周期激勵信號進行平滑處理和非線性處理，得到N個第一非周期激勵信號，具體包括：

將每一個非周期激勵信號與該非周期激勵信號相鄰的非周期激勵信號進行均值計算，得到N個平滑處理后的非周期激勵信號；

基于三角函數(shù)算法或指數(shù)函數(shù)算法，對每一個平滑處理后的非周期激勵信號進行非線性處理，獲得N個第一非周期激勵信號。

7.一種語音信號處理裝置，其特征在于，包括：

語音特征提取模塊，用于獲取語音片段中的N個語音特征；其中，N＞0；

變換處理模塊，用于對N個語音特征進行預設的不可逆變換處理，獲得N個第一語音特征；

分塊模塊，用于將N個第一語音特征劃分為K個語音特征塊；其中，語音特征塊包含若干個第一語音特征，N≥K＞0；

調(diào)整處理模塊，用于分別對每一個語音特征塊中的第一語音特征進行調(diào)整處理，獲得N個第二語音特征；其中，所述調(diào)整處理為從第k個語音特征塊中截取部分第一語音特征，或者根據(jù)第k個語音特征塊中的第一語音特征填充新的語音特征；其中，K≥k＞0；

合成模塊，用于將N個第二語音特征輸入至預設的聲碼器中，合成變聲后的語音信號。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司，未經(jīng)廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010932228.X/1.html，轉載請聲明來源鉆瓜專利網(wǎng)。

上一篇：微小金屬流道內(nèi)表面復合拋光用柔性線電極組件與方法
下一篇：一種玻璃茶具加工粉磨設備

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】