[發明專利]一種波形拼接語音合成的選音方法有效
| 申請號: | 201310481306.9 | 申請日: | 2013-10-15 |
| 公開(公告)號: | CN103531196A | 公開(公告)日: | 2014-01-22 |
| 發明(設計)人: | 陶建華;張冉;溫正棋 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 波形 拼接 語音 合成 方法 | ||
1.一種波形拼接語音合成的選音方法,其特征在于,該方法包括以下步驟:
步驟S1,基于從音頻數據庫中提取得到的原始音頻進行基于隱馬爾可夫的模型訓練,得到聲學模型集以及對應的特征決策樹;
步驟S2,輸入若干訓練文本,基于所述特征決策樹搜索得到相關聲學模型,進而得到對應的目標語音和目標音節;
步驟S3,根據所述目標語音與其對應的候選基元的相似度,和所述候選基元的各聲學參數在當前聲學模型下的似然概率,訓練得到相似度分類器;
步驟S4,輸入任意待合成文本,基于所述相似度分類器剔除不相似的候選基元,對于剩余的候選基元,利用拼接代價最小原則選擇得到最佳基元,并拼接得到合成語音。
2.根據權利要求1所述的方法,其特征在于,所述步驟S1進一步包括以下步驟:
步驟S11,獲取音頻數據庫中的原始音頻;
步驟S12,對于所述原始音頻按幀進行頻譜參數和基頻參數的提取;
步驟S13,對于所述原始音頻對應的文本進行同步的標注,標注出所述原始音頻中對應音節的上下文特征信息,同時對所述原始音頻進行音段切分標注;
步驟S14,基于所述原始音頻的頻譜參數和基頻參數,上下文特征信息標注,以及音段切分標注,進行傳統的隱馬爾可夫模型訓練,獲得包括時長、基頻和頻譜的模型集,以及各自的特征決策樹。
3.根據權利要求2所述的方法,其特征在于,所述步驟S12進一步包括以下步驟:
步驟S121,將所述原始音頻進行分幀加窗處理;
步驟S122,對處理得到的每幀音頻提取其梅爾倒譜系數;
步驟S123,計算每幀音頻的基頻參數。
4.根據權利要求1所述的方法,其特征在于,所述步驟S2進一步包括以下步驟:
步驟S21,輸入多個音節平衡的訓練文本,經過文本分析來獲取對應的上下文特征序列;
步驟S22,把所述上下文特征序列輸入到所述特征決策樹中,獲取符合當前上下文的聲學模型序列;
步驟S23,基于所述聲學模型序列,采用參數生成算法獲取目標語音參數;
步驟S24,基于所述目標語音參數,用聲碼器合成出目標句子語音,并將所述目標句子語音切分成目標音節。
5.根據權利要求4所述的方法,其特征在于,所述文本分析為對文本中的特征進行提取。
6.根據權利要求4所述的方法,其特征在于,所述步驟S22中,根據所述上下文特征序列中的上下文特征,分別對時長、基頻和頻譜參數的聚類樹進行決策,得到相應的聲學模型序列與時長模型。
7.根據權利要求4所述的方法,其特征在于,所述目標語音參數包括基頻和頻譜參數。
8.根據權利要求4所述的方法,其特征在于,所述步驟S3進一步包括以下步驟:
步驟S31,將所述音頻數據庫中的句子按音節進行切分,切分得到的以音節為單位的音段,即為候選基元,把相同的音節歸為一類,以此構建候選基元庫,并將所述步驟S12中提取得到的頻譜參數和基頻參數按幀分配給候選基元庫中的各個候選基元;
步驟S32,把每個所述目標音節對應的各個基元的聲學參數依次帶入所述步驟S22得到的上下文聲學模型中,計算各個基元的時長、基頻以及頻譜在其相應聲學模型下的概率,并把所有概率的集合作為特征集合;
步驟S33,召集若干漢語母語者對所述目標音節和候選基元的相似度進行二元標注,即相似或不相似,并把此結果作為分類屬性;
步驟S34,基于所述分類屬性和特征集合,進行相似度分類器的訓練。
9.根據權利要求8所述的方法,其特征在于,所述步驟S4進一步包括以下步驟:
步驟S41,輸入待合成文本,并根據所述步驟S22獲取對應的聲學模型;
步驟S42,根據所述步驟S32計算各基元的各聲學參數在當前聲學模型下的似然概率集合,并將其作為特征集合;
步驟S43,將所述特征集合輸入至所述相似度分類器中,即可預測出各基元屬于相似類別還是不相似類別;
步驟S44,去除不相似類別中的所有基元,對剩余的基元采用拼接代價最小原則進行選音;
步驟S45,對選擇得到的基元進行加窗平滑,得到最終的合成語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310481306.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電性連接裝置
- 下一篇:多屏幕集成顯示系統帶寬調整設備及其調整方法





