[發明專利]聲學模型建立、語音合成方法、裝置、設備及存儲介質有效
| 申請號: | 201811408961.0 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN109285537B | 公開(公告)日: | 2021-04-13 |
| 發明(設計)人: | 張冉 | 申請(專利權)人: | 北京羽扇智信息科技有限公司 |
| 主分類號: | G10L13/04 | 分類號: | G10L13/04;G10L13/06;G10L13/10 |
| 代理公司: | 北京睿派知識產權代理事務所(普通合伙) 11597 | 代理人: | 劉鋒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲學 模型 建立 語音 合成 方法 裝置 設備 存儲 介質 | ||
本發明實施例公開了一種聲學模型建立、語音合成方法、裝置、設備及存儲介質,其中聲學模型建立方法包括:從語料庫中獲取多個訓練樣本的音素序列樣本,并獲取所述音素序列樣本中每個音素的上下文特征以及每個音素的時長;其中,所述音素序列樣本中兒化音音素拆分成兩個音素;從所述訓練樣本中提取聲學特征;以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長作為聲學模型的輸入,以所述聲學特征作為所述聲學模型的輸出,對所述聲學模型進行訓練,得到預先訓練的聲學模型,可以使兒化音的建模性能較好,可以更好地實現兒化音的合成,可以合成語料庫中未出現的兒化音,同時可以降低語料庫中語料的錄制成本。
技術領域
本發明實施例涉及信息語音合成領域,特別是涉及一種聲學模型建立、語音合成方法、裝置、設備及存儲介質。
背景技術
隨著多媒體通信技術的不斷發展,作為人機交互重要方式之一的語音合成技術以其方便、快捷的優點受到了研究者的廣泛關注。語音合成是通過機械的、電子的方法產生人造語音的技術,它是將計算機自己產生的或者外部輸入的文字信息轉變為可以聽得懂的、流利的口語輸出的技術。語音合成的目的是將文本轉換為語音播放給用戶,目標是達到真人文本播報的效果。
語音合成技術已經獲得了廣泛的應用,例如語音合成技術已經用于信息流、地圖導航、閱讀、翻譯、智能家電等。其中,兒化是漢語普通話口語中頗具特色的一種音變現象,主要是由詞尾“兒”變化而來。詞尾“兒“本是一個獨立音節,長期與其前面音節流利地連讀而發生音變,“兒”失去獨立性,“化”到前一個音節上,只保持一個卷舌動作,且使其前面音節里的韻母或多或少地發生變化,如“老頭兒”、“鮮花兒”。兒化也是漢語普通話中一種非常重要的語言現象,經常在書面上出現,能起到區別詞性和意義,表達不同感情色彩的作用。
現有技術中,在語音合成中,一般語料庫中只錄制少量的兒化音并進行標注。發明人在具體實施過程中,發現現有技術中存在如下問題:如果覆蓋常見的應用場景,需要錄制較多的語料才能建立對兒化音合成效果較佳的聲學模型,但是語料錄制成本較高;若兒化音錄制較少,容易造成聲學模型中兒化音建模較差的問題;也無法借用語料庫中已有的韻母音素,對兒化音建模,并且無法合成語音合成庫中沒有出現的兒化音。
發明內容
本發明實施例提供了一種聲學模型建立、語音合成方法、裝置、設備及存儲介質,可以使聲學模型中兒化音的建模性能較好,可以更好地實現兒化音的合成,可以合成語料庫中未出現的兒化音,可以降低語料庫中語料的錄制成本。
為了解決上述問題,本發明實施例主要提供如下技術方案:
第一方面,本發明實施例提供了一種聲學模型建立方法,包括:
從語料庫中獲取多個訓練樣本的音素序列樣本,并獲取所述音素序列樣本中每個音素的上下文特征以及每個音素的時長;其中,所述音素序列樣本中兒化音音素拆分成兩個音素;
從所述訓練樣本中提取聲學特征;
以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長作為聲學模型的輸入,以所述聲學特征作為所述聲學模型的輸出,對所述聲學模型進行訓練,得到預先訓練的聲學模型
第二方面,本發明實施例還提供了一種語音合成方法,包括:
獲取模塊,用于從語料庫中獲取多個訓練樣本的音素序列樣本,并獲取所述音素序列樣本中每個音素的上下文特征以及每個音素的時長;其中,所述音素序列樣本中兒化音音素拆分成兩個音素;
提取模塊,用于從所述訓練樣本中提取聲學特征;
訓練模塊,用于以所述音素序列樣本,所述音素序列樣本中每個音素的上下文特征和時長作為聲學模型的輸入,以所述聲學特征作為所述聲學模型的輸出,對所述聲學模型進行訓練,得到預先訓練的聲學模型。
第三方面,本發明實施例提供了一種電子設備,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京羽扇智信息科技有限公司,未經北京羽扇智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811408961.0/2.html,轉載請聲明來源鉆瓜專利網。





