[發明專利]自動生成重讀音節語音的方法和系統在審
| 申請號: | 201110270759.8 | 申請日: | 2011-09-14 |
| 公開(公告)號: | CN102436807A | 公開(公告)日: | 2012-05-02 |
| 發明(設計)人: | 王歡良;鄒平 | 申請(專利權)人: | 蘇州思必馳信息科技有限公司 |
| 主分類號: | G10L13/00 | 分類號: | G10L13/00;G10L15/00;G10L15/02 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 215123 江蘇省蘇州工*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 生成 重讀 音節 語音 方法 系統 | ||
1.一種自動生成重讀音節語音的系統,包括:
音素定位模塊,用于確定接收到的語音信號中每個音素的位置,得到每個詞、音節和音素的時間邊界;
特征提取模塊,用于從語音信號中提取和音節重讀相關的特征以及頻譜特征;
特征修正模塊,用于利用預先估計出的特征變換參數,把輸入語音特征參數調整為對應的表示給定音節重讀的特征參數,并對調整后的特征參數進行平滑處理;
語音重構模塊,用于采用修正后的語音聲學特征參數通過源-濾波器模型重新合成語音;
特征變換參數庫,用于存放統計的每個音素從非重讀到重讀的聲學特征的變換矩陣參數。
2.如權利要求1所述的自動生成重讀音節語音的系統,其中音素定位模塊采用語音識別技術通過強制對齊或者網絡解碼來獲得音素邊界。
3.如權利要求1所述的自動生成重讀音節語音的系統,其中所述重讀相關的特征包括基音周期,聲強和音素時長;所述頻譜特征采用基頻自適應的平滑頻譜;所述重新生成的語音中指定音節的語音具有重讀特性;所述變換矩陣參數包括聲強和基音周期特征的變換參數和音素時長特征的變換參數。
4.如權利要求1所述的自動生成重讀音節語音的系統,其中特征修正模塊進行參數調整是利用預先計算的映射變換參數通過一個線性映射函數來完成。
5.一種自動生成重讀音節語音的方法,包括如下步驟:
步驟1、通過語音識別技術獲得輸入語音的詞、音節以及音素的時間邊界;
步驟2、從輸入語音中提取每個音素的重音相關特征和頻譜特征;
步驟3、根據音素類型和相對重讀音節的位置,從特征變換參數庫中獲取每個音素對應的特征變換矩陣,通過下式計算特定音節重讀之后語音中每個音素的重音相關特征向量:
其中:Vi(xp)表示輸入語音中音素xp的第i個特征向量,p表示音素x相對于重讀音節的位置類型,A(xp)表示位置類型為p的音素x的變換矩陣,表示位置類型為p的音素x的第i個特征向量變換后的特征向量;
步驟4、根據變換后每個音素片段的時長,通過下式對每個音素的基音周期特征、聲強特征和頻譜特征進行線性插值:
其中:d(xp)表示位置類型為p的音素的時長,表示位置類型為p的音素重讀變換后的時長,表示音素xp重讀變換后的基音周期、聲強和頻譜特征組成的第k個特征向量,表示插值后音素xp的基音周期、聲強和頻譜特征組成的第i個特征向量;
步驟5、在變換之后的特征上,對相鄰音素邊界處的頻譜特征逐幀采用長度為9的漢明窗(Hamming?Window)進行插值平滑處理,對相鄰音素邊界處的基音周期和聲強特征逐幀采用長度為11的矩形窗進行均值平滑處理;
步驟6、用變換之后的特征,包括基音周期,聲強和頻譜特征,通過源-濾波模型重新合成語音,輸出指定音節重讀的語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州思必馳信息科技有限公司,未經蘇州思必馳信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110270759.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:香蕉莖稈有機肥及其制備方法
- 下一篇:一種電源模塊地址的采樣方法及相關裝置





