[發明專利]韻律預測模型的優化方法及系統有效
| 申請號: | 201911421271.3 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111128122B | 公開(公告)日: | 2022-08-16 |
| 發明(設計)人: | 張晴;張輝 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10;G10L13/08 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 韻律 預測 模型 優化 方法 系統 | ||
本發明實施例提供一種韻律預測模型的優化方法。該方法包括:對韻律預測模型預測錯誤的語句進行分詞;將不帶有韻律標記的詞語確定為可替換詞語,對語句中可替換詞語進行同義詞增強,生成語句的第一訓練數據集;通過文本相似度從語料池中獲取與語句相似的其他語句,將其他語句向開發者反饋,接收開發者對其他語句內的詞語韻律標記后的第二訓練數據集;基于第一訓練數據集以及第二訓練數據集生成第三訓練數據集,通過第三訓練數據集對韻律預測模型進行自適應訓練,以優化韻律預測模型。本發明實施例還提供一種韻律預測模型的優化系統。本發明實施例優化有問題的語句韻律輸出結果,降低了人工標注成本,節約時間,提高韻律預測模型的預測效果。
技術領域
本發明涉及智能語音領域,尤其涉及一種韻律預測模型的優化方法及系統。
背景技術
對于當前的TTS(Text To Speech,從文本到語音)系統,韻律預測的方式主要有基于統計規則和基于神經網絡模型兩種,無論哪種方式,對于通用語料,都有20%左右的概率出現預測不合理。在實際應用場景里,如場景常用語句出現韻律預測不合理的情況,體驗會極大下降,如何基于反饋的問題語句進行有針對地優化韻律預測,提高實際場景的合成體驗,對于商用的TTS系統非常重要。
目前已有的針對錯誤語句的韻律優化的方案有:
(1)人工增加規則:通過對錯誤語句的特點分析總結,基于語句里分詞的詞面、詞性、詞長、句長等信息,在系統中加入對應規則,匹配相關語句并指定韻律等級。
(2)增加訓練數據:將問題語句通過人工標注后,加入到訓練數據,重新訓練模型或者規則,提高預測能力。
在實現本發明過程中,發明人發現相關技術中至少存在如下問題:
人工增加規則這種方案對需要優化的語句處理迅速,針對性強,但是規則靈活性不夠,修改后的效果經常出現如下情況:問題語句能夠預測正確,但是類似句子仍存在問題,覆蓋不全面。這對于商用TTS是非常不利的。增加訓練數據方案,增加的訓練數據的選擇十分重要,對于模型訓練,如果只加入反饋的錯誤語句,模型很難得到針對性的加強,加入語句過多,人工標注成本大,優化周期過長。
發明內容
為了至少解決現有技術中韻律預測模型的訓練覆蓋不全面,難以對模型得到針對性加強,數據的人工標注成本大,周期長的問題。
第一方面,本發明實施例提供一種韻律預測模型的優化方法,包括:
對韻律預測模型預測錯誤的語句進行分詞,其中,所述語句中韻律錯誤的詞語帶有韻律標記;
將不帶有所述韻律標記的詞語確定為可替換詞語,將帶有所述韻律標記的詞語確定為不可替換詞語,對所述語句中可替換詞語進行同義詞增強,生成所述語句的第一訓練數據集;
通過文本相似度從語料池中獲取與所述語句相似的其他語句,將所述其他語句向開發者反饋,接收開發者對所述其他語句內的詞語韻律標記后的第二訓練數據集;
基于至少一部分的所述第一訓練數據集以及至少一部分的所述第二訓練數據集生成第三訓練數據集,通過所述第三訓練數據集對所述韻律預測模型進行自適應訓練,以優化所述韻律預測模型。
第二方面,本發明實施例提供一種韻律預測模型的優化系統,包括:
語句分詞程序模塊,用于對韻律預測模型預測錯誤的語句進行分詞,其中,所述語句中韻律錯誤的詞語帶有韻律標記;
同義詞增強程序模塊,用于將不帶有所述韻律標記的詞語確定為可替換詞語,將帶有所述韻律標記的詞語確定為不可替換詞語,對所述語句中可替換詞語進行同義詞增強,生成所述語句的第一訓練數據集;
相似語句獲取程序模塊,用于通過文本相似度從語料池中獲取與所述語句相似的其他語句,將所述其他語句向開發者反饋,接收開發者對所述其他語句內的詞語韻律標記后的第二訓練數據集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911421271.3/2.html,轉載請聲明來源鉆瓜專利網。





