[發明專利]一種基于諧波沖激分解的語音轉換方法有效
| 申請號: | 201810335633.6 | 申請日: | 2018-04-16 |
| 公開(公告)號: | CN108766450B | 公開(公告)日: | 2023-02-17 |
| 發明(設計)人: | 簡志華;張石磊;郭珊;徐劍 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G10L19/02 | 分類號: | G10L19/02;G10L15/06;G10L13/02 |
| 代理公司: | 浙江千克知識產權代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 諧波 沖激 分解 語音 轉換 方法 | ||
本發明提出一種基于諧波沖激分解的語音轉換方法,包括如下步驟:S1,將語音信號分解成諧波信號和沖激信號;S2,將所述諧波信號進行語音轉換,形成目標諧波信號;S3,將所述目標諧波信號與所述沖激信號進行疊加,形成目標語音信號。本發明采用諧波沖激分解模型對語音信號進行分解,將語音信號分解成諧波信號部分和沖激信號部分,僅對諧波信號部分做頻譜分解和稀疏表示,不對沖激信號做任何處理,既能夠保證信息的完全性、又可以減少信息的丟失,還有利于提高轉換后語音的質量,處理過程簡單、方便,推廣性強,具有較高的應用前景。
技術領域
本發明屬于語音轉換技術領域,具體涉及一種基于諧波沖激分解的語音轉換方法。
背景技術
說話人身份特征是語音信號中所包含的一種非常重要的特征信息。語音轉換的處理對象就是語音信號中的身份特征信息,它的目的就是要改變源語音中的身份特征,使得轉換后的語音聽起來就像是特定的目標說話人的聲音一樣。語音轉換技術具有廣泛的應用前景,特別是應用于個性化的語音合成領域。
發明內容
本發明提出一種基于諧波沖激分解的語音轉換方法,以提高語音轉換后的語音質量,簡化語音轉換處理過程。
為實現本發明的目的,本發明采用以下技術方案:
一種基于諧波沖激分解的語音轉換方法,包括如下步驟:
S1,將語音信號分解成諧波信號和沖激信號;
S2,將所述諧波信號進行語音轉換,形成目標諧波信號;
S3,將所述目標諧波信號與所述沖激信號進行疊加,形成目標語音信號。
進一步地,步驟S1中,將語音信號分解成諧波信號和沖激信號的具體步驟如下:
S11,采用STRAIGHT模型對所述語音信號進行建模,得到該語音信號的頻譜矢量序列
X,X表示成語音信號的語譜圖;
S12,計算水平方向的幅度譜和垂直方向的幅度譜分別為:
其中m表示語譜圖的時間點,k表示語譜圖的頻點;wh用來描述水平方向中值濾波器的長度;wp用來描述垂直方向中值濾波器的長度;median(·)表示中值濾波函數。
S13,對語音信號的語譜圖X進行標記,得到諧波信號的標記矩陣Mh和沖激信號的標記矩陣Mp,即:
S14,計算所述語音信號的諧波信號頻譜Xh(m,k)和沖激信號頻譜Xp(m,k),即:
Xh(m,k)=X(m,k)·Mh(m,k)
Xp(m,k)=X(m,k)·Mp(m,k)
進一步地,所述方法整體包括訓練階段和轉換階段,
在所述訓練階段,所述語音信號包括源語音信號和樣本語音信號,所述步驟S1中,對所述源語音信號和樣本語音信號進行激光沖激分解,同時提取梅爾頻率倒譜系數MFCC,用MFCC根據動態時間規整算法對源語音信號和樣本語音信號在時間上進行規整并保留時間對齊信息;
在所述轉換階段,所述語音信號為源語音信號,所述步驟S1中,對所述源語音信號進行激光沖激分解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810335633.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種音頻信號的可逆水印實現方法
- 下一篇:修音方法及裝置





