[發明專利]一種基于文本信息的波形拼接語音合成方法有效
| 申請號: | 201410362838.5 | 申請日: | 2014-07-28 |
| 公開(公告)號: | CN104112444B | 公開(公告)日: | 2018-11-06 |
| 發明(設計)人: | 陶建華;劉善峰 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G10L13/08 | 分類號: | G10L13/08;G10L13/02 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文本 信息 波形 拼接 語音 合成 方法 | ||
本發明一種基于文本信息的波形拼接語音合成方法,該方法包括:步驟S1:通過音段切分,提取原始音頻中所有基元的聲學參數與文本參數,根據提取的參數訓練時長預測模型與權重預測模型;步驟S2:采用分層預選方法,利用文本分析的目標基元、時長預測模型預測的時長對語料庫中的基元進行初步預選,獲得候選基元;步驟S3:對目標基元、候選基元和權重預測模型預測的權重信息計算,得到目標代價;對相鄰兩個基元的契合度進行計算,得到拼接代價;用維特比搜索方法對目標代價和拼接代價進行搜索,得到最小代價路徑,進而得到最佳基元并經過平滑拼接得到合成語音。
技術領域
本發明屬于智能信息處理領域,涉及一種基于文本信息的波形拼接系統。
背景技術
語音作為人機交互的主要手段之一,語音合成主要目的是讓計算機能夠產生高清晰度、高自然度的連續語音。語音合成主要有兩種方式,早期的研究主要是采用參數語音合成,最常用的合成方法是基于隱馬爾柯夫的參數語音合成方法。該方法作為一種基于統計聲學建模方法的具休實現,對語音的聲學參數進行隱馬爾柯夫建模,并通過參數生成算法來重構聲學參數軌跡,最后調用語音合成器來產生語音波形。該方法的不足在于合成語音的音質、自然度和清晰度都不夠理想,與實際語音具有較大的差距。另一種方法是基于語料庫的語音拼接合成方法,該方法是直接從原始錄制的語料庫中挑選合適的基元來進行拼接合成語音。
但該方法雖能合成出較為接近原始語音的波形,但受限于語料庫大小的制約,合成語音的穩定性不夠理想(音庫過大,合成語音速度較慢,無法實時合成;音庫過小,合成語音不穩定),很大程度上影響的聽感。并且現有的拼接合成系統,在計算代價時缺少考慮文本信息對基元的影響,合成出的語音在韻律表現上也不是很好。
發明內容
(一)要解決的技術問題
為解決上述的一個或多個問題,本發明的目的是提供一種基于文本信息的波形拼接語音合成方法。
(二)技術方案
為達成所述目的,本發明提供的一種基于文本信息的波形拼接語音合成方法實現的步驟包括:
步驟S1:通過音段切分,提取原始音頻中所有基元的聲學參數與文本參數,根據提取的參數訓練時長預測模型與權重預測模型;
步驟S2:采用分層預選方法,利用文本分析的目標基元、時長預測模型預測的時長對語料庫中的基元進行初步預選,獲得候選基元;
步驟S3:對目標基元、候選基元和權重預測模型預測的權重信息計算,得到目標代價;對相鄰兩個基元的契合度進行計算,得到拼接代價;用維特比搜索方法對目標代價和拼接代價進行搜索,得到最小代價路徑,進而得到最佳基元并經過平滑拼接得到合成語音。
(三)有益效果
從上述技術方案可以看出,本發明基于文本特征的波形拼接語音合成方法具有以下有益效果:
(1)該方法結合待合成語音與原始語音的文本特征,在基元預選時用分層預選方法,不僅能有效率的在保證候選基元接近目標基元的情況下,減少基元的個數,降低后期代價計算的時間開銷,提高了合成語音的效率,增強拼接合成的實時性;并且加入的時長預測模型能保證選到的基元在時長上的連續性,提高了合成語音自然度;
(2)目標代價的計算方法采用的是基于文本信息結合預測得到的權重信息得到的代價,保證了代價最小的基元在韻律上與目標基元的一致性,拼接合成出高自然度,并提高了合成語音的韻律表現;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410362838.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種選擇編碼模式的方法及裝置
- 下一篇:投影儀
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





