[發(fā)明專利]一種基于諧波沖激分解的語音轉換方法有效
| 申請?zhí)枺?/td> | 201810335633.6 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN108766450B | 公開(公告)日: | 2023-02-17 |
| 發(fā)明(設計)人: | 簡志華;張石磊;郭珊;徐劍 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L15/06;G10L13/02 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 諧波 沖激 分解 語音 轉換 方法 | ||
1.一種基于諧波沖激分解的語音轉換方法,其特征在于,包括如下步驟:
S1,將語音信號分解成諧波信號和沖激信號;
S2,將所述諧波信號進行語音轉換,形成目標諧波信號;
S3,將所述目標諧波信號與所述沖激信號進行疊加,形成目標語音信號;
步驟S1中,將語音信號分解成諧波信號和沖激信號的具體步驟如下:
S11,采用STRAIGHT模型對所述語音信號進行建模,得到該語音信號的頻譜矢量序列X,X表示成語音信號的語譜圖;
S12,計算水平方向的幅度譜和垂直方向的幅度譜分別為:
其中m表示語譜圖的時間點,k表示語譜圖的頻點;wh用來描述水平方向中值濾波器的長度;wp用來描述垂直方向中值濾波器的長度;median(·)表示中值濾波函數(shù);
S13,對語音信號的語譜圖X進行標記,得到諧波信號的標記矩陣Mh和沖激信號的標記矩陣Mp,即:
S14,計算所述語音信號的諧波信號頻譜Xh(m,k)和沖激信號頻譜Xp(m,k),即:
Xh(m,k)=X(m,k)·Mh(m,k)
Xp(m,k)=X(m,k)·Mp(m,k)。
2.根據(jù)權利要求1所述的方法,其特征在于:所述方法包括訓練階段和轉換階段,在所述訓練階段,所述語音信號包括源語音信號和樣本語音信號,步驟S1中,對所述源語音信號和樣本語音信號進行激光沖激分解,同時提取梅爾頻率倒譜系數(shù)MFCC,用MFCC根據(jù)動態(tài)時間規(guī)整算法對源語音信號和樣本語音信號在時間上進行規(guī)整并保留時間對齊信息;
在所述轉換階段,所述語音信號為源語音信號,步驟S1中,對所述源語音信號進行激光沖激分解。
3.根據(jù)權利要求2所述的方法,其特征在于:
步驟S2中,將諧波信號進行語音轉換形成目標諧波信號,是指對所述諧波信號頻譜進行轉換形成目標諧波信號頻譜,具體為:
S21,根據(jù)所述時間對齊信息,隨機抽取源語音信號和樣本語音信號相同位置的諧波信號頻譜構造平行的源語音字典A和樣本語音字典B,并存儲,之后結束所述訓練階段;
S22,在所述轉換階段,對源語音信號的諧波信號頻譜Xh(m,k)進行稀疏表示;即
Xh(m,k)=AH
激勵矩陣H∈RN×M,其中,N表示基矢量的個數(shù),M表示語音信號的幀數(shù),激勵矩陣H由激勵矢量h迭代求解,
其中,A是源語音字典,x∈RK×1表示一幀語音信號的幅度譜,K表示一幀幅度譜的維數(shù),I表示K維的數(shù)值全為1的矢量,λ表示K維的懲罰因子矢量,T表示矩陣轉置運算符,.×表示矩陣對應點之間相乘運算符;
S23,在所述轉換階段,利用源語音信號的激勵矩陣H和樣本語音信號的諧波信號樣本字典B對源語音的諧波信號頻譜進行轉換,轉換后的目標諧波信號頻譜表示為
4.根據(jù)權利要求3所述的方法,其特征在于:
步驟S3中,將所述目標諧波信號與所述沖激信號進行疊加,形成目標語音信號的具體步驟為:將轉換后的目標諧波信號頻譜和未經(jīng)過處理的源語音沖激信號部分進行疊加,得到轉換后的目標語音頻譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經(jīng)杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810335633.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種音頻信號的可逆水印實現(xiàn)方法
- 下一篇:修音方法及裝置





