[發明專利]基于韻律參照的語音合成裝置和方法無效
| 申請號: | 200810166002.2 | 申請日: | 2008-09-28 |
| 公開(公告)號: | CN101685633A | 公開(公告)日: | 2010-03-31 |
| 發明(設計)人: | 郭慶;陸應亮;王彬 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08 |
| 代理公司: | 北京三友知識產權代理有限公司 | 代理人: | 李 輝 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 韻律 參照 語音 合成 裝置 方法 | ||
1、一種基于韻律參照進行語音合成的語音合成裝置,其包括:
韻律參數獲取部,其通過對按包括自然人朗讀待合成文本在內的方式而獲得的該待合成文本的錄音文件進行分析,或者對以預定標注標準對待合成文本進行韻律參數標注而獲得的韻律參數標注文件進行分析,來獲取自然韻律參數或近似自然韻律參數;和
音聲作成部,其以該自然韻律參數或近似自然韻律參數作為參照,針對該待合成文本從預錄語音庫中選擇相應的語音合成單元,并對所述語音合成單元進行拼接合成,以產生對應于該待合成文本的合成語音文件。
2、如權利要求1所述的語音合成裝置,其中,該音聲作成部包括:
語音單元選擇部,其以該自然韻律參數或近似自然韻律參數作為參照,從該預錄語音庫中選擇針對該待合成文本全局最優的語音合成單元;和
波形生成部,其基于該自然韻律參數或近似自然韻律參數,對該語音單元選擇部選擇的語音合成單元進行拼接合成并對合成后的語音文件進行波形調整,以獲得對應于該待合成文本的具有高自然度的合成語音文件。
3、如權利要求2所述的語音合成裝置,其中,該韻律參數獲取部包括:
錄音部,其通過自然人朗讀該待合成文本而獲得該待合成文本的錄音文件;和
韻律參數提取部,其從該錄音文件的波形數據中獲得韻律參數,該韻律參數包括音長、音頻和能量。
4、如權利要求2所述的語音合成裝置,其中,該韻律參數獲取部包括:
韻律參數標注部,其參照定義了韻律參數的標注規則的知識庫以該預定標注標準對該待合成文本進行韻律參數標注,以獲得韻律參數標注文件;和
韻律參數生成部,其對該韻律參數標注文件進行分析,以獲得近似韻律參數,該近似韻律參數包括音長、音頻和能量。
5、如權利要求1所述的語音合成裝置,其中,該待合成文本的錄音文件是通過電子卡通發音的方式獲得的。
6、一種基于韻律參照進行語音合成的方法,其包括以下步驟:
韻律參數獲取步驟,其通過對按包括自然人朗讀待合成文本在內的方式而獲得的該待合成文本的錄音文件進行分析,或者對以預定標注標準對待合成文本進行韻律參數標注而獲得的韻律參數標注文件進行分析,來獲取自然韻律參數或近似自然韻律參數;和
音聲作成步驟,其以該自然韻律參數或近似自然韻律參數作為參照,針對該待合成文本從預錄語音庫中選擇相應的語音合成單元,并對所述語音合成單元進行拼接合成,以產生對應于該待合成文本的合成語音文件。
7、如權利要求6所述的方法,其中,該音聲作成步驟包括:
以該自然韻律參數或近似自然韻律參數作為參照,從該預錄語音庫中選擇針對該待合成文本全局最優的語音合成單元;和
基于該自然韻律參數或近似自然韻律參數,對所選擇的語音合成單元進行拼接合成并對合成后的語音文件進行波形調整,以獲得對應于該待合成文本的具有高自然度的合成語音文件。
8、如權利要求7所述的方法,其中,該韻律參數獲取步驟包括:
通過自然人朗讀該待合成文本而獲得該待合成文本的錄音文件;和
從該錄音文件的波形數據中獲得韻律參數,該韻律參數包括音長、音頻和能量。
9、如權利要求7所述的方法,其中,該韻律參數獲取步驟包括:
參照定義了韻律參數的標注規則的知識庫以該預定標注標準對該待合成文本進行韻律參數標注,以獲得韻律參數標注文件;和
對該韻律參數標注文件進行分析,以獲得近似韻律參數,該近似韻律參數包括音長、音頻和能量。
10、如權利要求6所述的方法,其中,通過電子卡通發音的方式來獲得該待合成文本的錄音文件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社,未經富士通株式會社許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810166002.2/1.html,轉載請聲明來源鉆瓜專利網。





