[發(fā)明專利]一種語音信號處理方法、裝置、存儲介質及終端設備在審
| 申請?zhí)枺?/td> | 202010932228.X | 申請日: | 2020-09-07 |
| 公開(公告)號: | CN112185403A | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設計)人: | 徐波 | 申請(專利權)人: | 廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司 |
| 主分類號: | G10L21/007 | 分類號: | G10L21/007;G10L21/013;G10L13/033;G10L19/16 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 信號 處理 方法 裝置 存儲 介質 終端設備 | ||
1.一種語音信號處理方法,其特征在于,包括:
獲取語音片段中的N個語音特征;其中,N>0;
對N個語音特征進行預設的不可逆變換處理,獲得N個第一語音特征;
將N個第一語音特征劃分為K個語音特征塊;其中,語音特征塊包含若干個第一語音特征,N≥K>0;
分別對每一個語音特征塊中的第一語音特征進行調(diào)整處理,獲得N個第二語音特征;其中,所述調(diào)整處理為從第k個語音特征塊中截取部分第一語音特征,或者根據(jù)第k個語音特征塊中的第一語音特征填充新的語音特征;其中,K≥k>0;
將N個第二語音特征輸入至預設的聲碼器中,合成變聲后的語音信號。
2.如權利要求1所述的語音信號處理方法,其特征在于,任一語音特征包括基音頻率、共振峰頻譜包絡、非周期激勵信號;則,所述獲取語音片段中的N個語音特征,具體包括:
按照預設的幀長度對所述語音片段進行分幀,獲得N個幀信號;
基于DIO算法提取每一個幀信號中的基音頻率,獲得N個基音頻率;
基于CheapTrick算法提取每一個幀信號中的共振峰頻譜包絡,獲得N個共振峰頻譜包絡;
基于PLATINUM算法提取每一個幀信號中的非周期激勵信號,獲得N個非周期激勵信號。
3.如權利要求2所述的語音信號處理方法,其特征在于,每一個第一語音特征包括第一基音頻率、第一共振峰頻譜包絡、第一非周期激勵信號,則,所述對N個語音特征進行預設的不可逆變換處理,獲得N個第一語音特征,具體包括:
對每一個基音頻率進行平滑處理、非線性處理和調(diào)頻處理,得到N個第一基音頻率;
對每一個共振峰頻譜包絡進行移動處理和平滑處理,得到N個第一共振峰頻譜包絡;
對每一個非周期激勵信號進行平滑處理和非線性處理,得到N個第一非周期激勵信號。
4.如權利要求3所述的語音信號處理方法,其特征在于,所述對每一個基音頻率進行平滑處理、非線性處理和調(diào)頻處理,得到N個第一基音頻率,具體包括:
將每一個基音頻率與該基音頻率相鄰的基音頻率進行均值計算,得到N個平滑處理后的基音頻率;
基于三角函數(shù)算法或指數(shù)函數(shù)算法,對每一個平滑處理后的基音頻率進行非線性處理,獲得N個非線性處理后的基音頻率;
以預設的頻率范圍為參考,將每一個非線性處理后的基音頻率映射到所述頻率范圍內(nèi),得到N個第一基音頻率。
5.如權利要求3所述的語音信號處理方法,其特征在于,所述對每一個共振峰頻譜包絡進行移動處理和平滑處理,得到N個第一共振峰頻譜包絡,具體包括:
將每一個共振峰頻譜包絡循環(huán)移動N個單位,獲得N個移動處理后的共振峰頻譜包絡;
對每一個移動處理后的共振峰頻譜包絡與該移動處理后的共振峰頻譜包絡相鄰的移動處理后的共振峰頻譜包絡進行均值計算,得到N個第一共振峰頻譜包絡。
6.如權利要求3所述的語音信號處理方法,其特征在于,所述對每一個非周期激勵信號進行平滑處理和非線性處理,得到N個第一非周期激勵信號,具體包括:
將每一個非周期激勵信號與該非周期激勵信號相鄰的非周期激勵信號進行均值計算,得到N個平滑處理后的非周期激勵信號;
基于三角函數(shù)算法或指數(shù)函數(shù)算法,對每一個平滑處理后的非周期激勵信號進行非線性處理,獲得N個第一非周期激勵信號。
7.一種語音信號處理裝置,其特征在于,包括:
語音特征提取模塊,用于獲取語音片段中的N個語音特征;其中,N>0;
變換處理模塊,用于對N個語音特征進行預設的不可逆變換處理,獲得N個第一語音特征;
分塊模塊,用于將N個第一語音特征劃分為K個語音特征塊;其中,語音特征塊包含若干個第一語音特征,N≥K>0;
調(diào)整處理模塊,用于分別對每一個語音特征塊中的第一語音特征進行調(diào)整處理,獲得N個第二語音特征;其中,所述調(diào)整處理為從第k個語音特征塊中截取部分第一語音特征,或者根據(jù)第k個語音特征塊中的第一語音特征填充新的語音特征;其中,K≥k>0;
合成模塊,用于將N個第二語音特征輸入至預設的聲碼器中,合成變聲后的語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司,未經(jīng)廣州多益網(wǎng)絡股份有限公司;廣東利為網(wǎng)絡科技有限公司;多益網(wǎng)絡有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010932228.X/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉HDMI信號的信號轉換線
- 信號盒(信號轉換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





