[發(fā)明專利]一種基于混合隱馬爾可夫模型的語音合成系統(tǒng)無效
| 申請?zhí)枺?/td> | 200710304225.6 | 申請日: | 2007-12-26 |
| 公開(公告)號: | CN101471071A | 公開(公告)日: | 2009-07-01 |
| 發(fā)明(設(shè)計)人: | 陶建華;于劍;張蒙 | 申請(專利權(quán))人: | 中國科學院自動化研究所 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/06;G10L13/08 |
| 代理公司: | 中科專利商標代理有限責任公司 | 代理人: | 梁愛榮 |
| 地址: | 100080北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 混合 隱馬爾可夫 模型 語音 合成 系統(tǒng) | ||
1、一種基于混合隱馬爾可夫模型的語音合成系統(tǒng),利用各種電腦終端及數(shù)字移動設(shè)備,將系統(tǒng)接收的或輸入的任意文字串轉(zhuǎn)換成語音輸出,其特征在于:由頻譜信息生成模塊、基頻信息生成模塊、參數(shù)語音合成器模塊、離線訓練部分組成,其中:
具有一頻譜信息生成模塊,輸入端接收任意文本信息,負責根據(jù)指標來選取表征頻譜信息的碼本矢量并產(chǎn)生完整的頻譜信息;具有一輸出端輸出完整的頻譜信息;
具有一基頻信息生成模塊,輸入端接收文本信息,負責預(yù)測待合成句子的音高變化;具有一輸出端輸出完整的基頻曲線;
具有一參數(shù)語音合成器模塊,輸入端接收來自于頻譜信息生成模塊的頻譜信息和來自于基頻信息生成模塊的基頻信息;具有一輸出端輸出合成的語音結(jié)果;
具有一離線訓練模塊,負責各種隱馬爾可夫模型的訓練。
2、根據(jù)權(quán)利要求1所述的基于混合隱馬爾可夫模型的語音合成系統(tǒng),其特征在于:所述頻譜信息生成模塊包括:
具有一隱馬爾可夫模型映射模塊,接受任意文本信息,將其表征為帶有韻律信息標注的音素序列,找到與其最符合的隱馬爾可夫模型;具有一輸出端輸出隱馬爾可夫模型狀態(tài)序列;
具有一離散隱馬爾可夫模型模塊,根據(jù)訓練得到的離散隱馬爾可夫模型得到當前狀態(tài)下碼本矢量的輸出概率;具有一輸出端輸出當前狀態(tài)下碼本矢量的輸出概率;根據(jù)該輸出概率進行碼本的選擇,保證碼本選擇的正確性;
具有一有關(guān)共振峰軌跡的多空間概率隱馬爾可夫模型模塊,根據(jù)訓練得到的多空間概率隱馬爾可夫模型得到當前狀態(tài)下的共振峰軌跡;具有一輸出端輸出當前狀態(tài)下的共振峰軌跡;合成語音的共振峰軌跡應(yīng)該與該理想的共振峰軌跡相吻合,保證語音的清晰度;
具有一拼接概率模塊,具有一輸出端輸出相鄰狀態(tài)之間所有碼本矢量的輸出概率;依據(jù)兩兩候選碼本之間相鄰的概率進行碼本選擇,使頻譜在時域上具有多樣性;
具有一有關(guān)能量軌跡的連續(xù)隱馬爾可夫模型模塊,根據(jù)訓練得到的連續(xù)隱馬爾可夫模型得到當前狀態(tài)下的能量軌跡;具有一輸出端輸出當前狀態(tài)下的能量軌跡;
具有一碼本選擇模塊,根據(jù)離散隱馬爾可夫模型模塊、有關(guān)共振峰軌跡的多空間概率隱馬爾可夫模型模塊和拼接概率模塊的輸出結(jié)果使用動態(tài)規(guī)劃算法進行碼本的選擇;具有一輸出端輸出選擇得到的碼本序列;
碼本選擇模塊的輸出和有關(guān)能量軌跡的連續(xù)隱馬爾可夫模型模塊的輸出,兩者結(jié)合,獲得完整的頻譜信息。
3、根據(jù)權(quán)利要求1所述的基于混合隱馬爾可夫模型的語音合成系統(tǒng),其特征在于:所述基頻信息生成模塊包括:
具有一有關(guān)基頻曲線的多空間概率分布隱馬爾可夫模塊,根據(jù)訓練得到的多空間概率分布隱馬爾可夫模型得到待合成語句的基頻曲線;具有一輸出端輸出待合成語句的基頻曲線。
4、根據(jù)權(quán)利要求1所述的基于混合隱馬爾可夫模型的語音合成系統(tǒng),其特征在于:所述參數(shù)語音合成器模塊包括:
具有一語音參數(shù)合成器模塊,接受來自頻譜信息生成模塊和基頻信息生成模塊的輸出;具有一輸出端輸出合成的語音。
5、根據(jù)權(quán)利要求1所述的基于混合隱馬爾可夫模型的語音合成系統(tǒng),其特征在于:所述離線訓練模塊包括:
具有一離散隱馬爾可夫模型訓練模塊,負責對所有頻譜矢量進行矢量量化,并進行離散隱馬爾可夫模型的訓練;
具有一連續(xù)隱馬爾可夫模型訓練模塊,使用連續(xù)隱馬爾可夫模型進行能量軌跡的訓練;
具有一多空間隱馬爾可夫模型訓練模塊,使用多空間概率隱馬爾可夫模型進行基頻曲線、共振峰軌跡的訓練。
6、根據(jù)權(quán)利要求1所述的基于混合隱馬爾可夫模型的語音合成系統(tǒng),其特征在于:所述離散隱馬爾可夫模型訓練模塊包括:
具有一矢量量化模塊,負責將語料中所有頻譜矢量表示為有限的類別數(shù),具有一輸出端用于輸出頻譜矢量有限的類別數(shù);
具有一訓練模塊具有一輸入端與矢量量化模塊的輸出端連接,接收頻譜矢量有限的類別數(shù),用于訓練離散隱馬爾可夫模型得到每個狀態(tài)下碼本矢量對應(yīng)的輸出概率,具有一輸出端用于輸出碼本概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院自動化研究所,未經(jīng)中國科學院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710304225.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 認知無線電系統(tǒng)中基于隱馬爾可夫模型的頻譜接入方法
- 一種基于隱馬爾可夫模型的人臉識別方法
- 基于隱馬爾可夫模型的英文簡歷關(guān)鍵字段抽取方法
- 基于遺傳算法的隱馬爾科夫模型在主機風險評估中的應(yīng)用
- 用于推薦系統(tǒng)的數(shù)據(jù)處理方法、數(shù)據(jù)處理裝置和電子設(shè)備
- SDN數(shù)據(jù)中心基于隱馬爾可夫模型的多徑路由選徑方法
- 基于高斯混合的因子隱馬爾可夫負荷分解方法
- 一種外骨骼步態(tài)辨識方法和裝置
- 隱馬爾可夫模型在地圖匹配中的優(yōu)化方法及GPS定位方法
- 基于隱馬爾可夫模型的Costas信號解碼方法、系統(tǒng)及存儲介質(zhì)





