[發明專利]聲學模型建立、語音合成方法、裝置、設備及存儲介質有效
| 申請號: | 201811408961.0 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN109285537B | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 張冉 | 申請(專利權)人: | 北京羽扇智信息科技有限公司 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L13/06;G10L13/10 |
| 代理公司: | 北京睿派知識產權代理事務所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲學 模型 建立 語音 合成 方法 裝置 設備 存儲 介質 | ||
1.一種聲學模型建立方法,其特征在于:包括:
從語料庫中獲取多個訓練樣本的音素序列樣本,并獲取所述音素序列樣本中每個音素的上下文特征以及每個音素的時長;其中,所述音素序列樣本中兒化音音素的非兒化部分和兒化部分拆分,得到兩個音素,所述兒化部分的音素帶有標識;
從所述訓練樣本中提取聲學特征;
以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長作為聲學模型的輸入,以所述聲學特征作為所述聲學模型的輸出,對所述聲學模型進行訓練,得到預先訓練的聲學模型。
2.根據權利要求1所述的方法,其特征在于,還包括:
將所述音素序列樣本以及所述音素序列樣本中每個音素的上下文特征作為時長模型的輸入,以所述音素序列樣本中每個音素的時長作為所述時長模型的輸出,對所述時長模型進行訓練,得到預先訓練的時長模型。
3.根據權利要求1所述的方法,其特征在于,所述兒化音的音素拆分成的兩個音素的時長之和,等于所述兒化音的音素在拆分之前的時長。
4.根據權利要求1所述的方法,其特征在于,所述上下文特征包括每個音素在所述音素序列樣本中的位置,在每個音素之前的音素以及在每個音素之后的音素。
5.一種語音合成方法,其特征在于,包括:
獲取待合成文本;
確定與所述待合成文本對應的音素序列,其中,所述待合成文本中的兒化音的音素的非兒化部分和兒化部分拆分,得到兩個音素,所述兒化部分的音素帶有標識;
確定所述音素序列中每個音素的上下文特征,并基于預先訓練的時長模型確定每個音素的時長;
以所述音素序列,所述音素序列中每個音素的上下文特征和時長輸入到預先訓練的聲學模型中,得到所述待合成文本的聲學特征;
基于所述聲學特征,合成所述待合成文本的語音。
6.一種聲學模型建立裝置,其特征在于:包括:
獲取模塊,用于從語料庫中獲取多個訓練樣本的音素序列樣本,并獲取所述音素序列樣本中每個音素的上下文特征以及每個音素的時長;其中,所述音素序列樣本中兒化音音素的非兒化部分和兒化部分拆分,得到兩個音素,所述兒化部分的音素帶有標識;
提取模塊,用于從所述訓練樣本中提取聲學特征;
訓練模塊,用于以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長作為聲學模型的輸入,以所述聲學特征作為所述聲學模型的輸出,對所述聲學模型進行訓練,得到預先訓練的聲學模型。
7.一種語音合成裝置,其特征在于,包括:
獲取模塊,用于獲取待合成文本;
第一確定模塊,用于確定與所述待合成文本對應的音素序列,其中,所述待合成文本中的兒化音的音素的非兒化部分和兒化部分拆分,得到兩個音素,所述兒化部分的音素帶有標識;
第二確定模塊,用于確定所述音素序列中每個音素的上下文特征,并基于預先訓練的時長模型確定每個音素的時長;
聲學特征確定模塊,用于以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長輸入到預先訓練的聲學模型中,得到所述待合成文本的聲學特征;
合成模塊,用于基于所述聲學特征,合成所述待合成文本的語音。
8.一種電子設備,其特征在于,包括:
至少一個處理器;
以及與所述處理器連接的至少一個存儲器、總線;其中,
所述處理器、存儲器通過所述總線完成相互間的通信;
所述處理器用于調用所述存儲器中的程序指令,以執行權利要求1-4任一項所述聲學模型建立方法,或者執行權利要求5所述的一種語音合成方法。
9.一種非暫態計算機可讀存儲介質,其特征在于,所述非暫態計算機可讀存儲介質存儲計算機指令,所述計算機指令使所述計算機執行權利要求1-4任一項所述的聲學模型建立方法,或者執行權利要求5所述的一種語音合成方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京羽扇智信息科技有限公司,未經北京羽扇智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811408961.0/1.html,轉載請聲明來源鉆瓜專利網。





