[發明專利]一種韻律預測方法及系統有效
| 申請號: | 201610084393.8 | 申請日: | 2016-02-04 |
| 公開(公告)號: | CN107039034B | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | 周明;江源;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 周放;江懷勤 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 韻律 預測 方法 系統 | ||
本發明公開了一種韻律預測方法及系統,該方法包括:預先構建文本韻律模型,收集具有對應語音數據的文本數據,基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據,利用所述自動標注文本數據訓練文本韻律模型;接收待預測文本數據;然后提取待預測文本數據的文本特征;最終利用所述文本特征及所述文本韻律模型,對所述待預測文本數據進行韻律預測。由于本發明收集的文本數據都有對應的語音數據,該語音數據實際含有韻律信息,可以對所述文本數據進行自動韻律標注,能解決了現有技術需要人工標注所有訓練文本數據的韻律邊界來訓練文本韻律模型,導致人工成本較高,耗時較長的問題。
技術領域
本發明涉及自然語言處理領域,具體涉及一種韻律預測方法及系統。
背景技術
語音合成是語言信息處理中的重要組成部分,是指把文本通過一定的轉換后,輸出語音的過程,并盡量使合成的語音具有良好的自然度與可懂度。韻律預測主要針對文本數據中韻律短語的預測,預測出文本數據中相應韻律邊界位置。韻律預測方法一般用于語音合成的前端文本處理中,預測出韻律邊界位置后,可以在語音合成時根據相應韻律邊界位置給出相應停頓,從而提高合成自然度;此外,也可以用于自然語言理解,不同的韻律劃分往往會得到不同的語義信息。所述韻律短語指自然語言交流中,由若干個字或詞組成的具有穩定韻律模式的語言單位,相鄰韻律短語之間通常存在停頓,以便于形成合適的節奏;如文本數據“更像一個沉重的包袱#壓在人們心頭?!?,其中“#”為韻律邊界標識符,用于標識韻律邊界。
文本數據的韻律預測一直是文本處理中的重要工作,尤其是語音合成的前端文本處理,韻律邊界位置直接影響到合成語音的自然度;當然,其在自然語言理解中也起著重要的作用,不同的韻律劃分往往會得到不同的語義信息,如“此地安能久在”,如果韻律邊界劃分成“此地安#能久在”,會得到與原文完全不同的含義,因此,準確的預測出文本數據的韻律邊界有著重要的意義?,F有的韻律預測方法一般是通過有監督的方法構建文本韻律模型對文本數據的韻律進行預測,得到韻律預測結果。其中,在模型構建時,現有技術需要人工標注所有訓練文本數據的韻律邊界來訓練文本韻律模型,人工成本較高,耗時較長;此外,在模型構建時,現有技術使用淺層學習模型作為文本韻律模型,淺層學習模型對數據的描述能力有限,當訓練數據達到一定規模時,模型容易飽和,從而無法有效利用大量數據來提升文本韻律模型的預測準確率。
發明內容
本發明實施例提供一種韻律預測方法及系統,以解決現有技術在模型構建時,需要人工標注所有訓練文本數據的韻律邊界來訓練文本韻律模型,導致人工成本較高,耗時較長的問題。
為此,本發明實施例提供如下技術方案:
一種韻律預測方法,包括:
預先構建文本韻律模型;
接收待預測文本數據;
提取待預測文本數據的文本特征;
利用所述文本特征及所述文本韻律模型,對所述待預測文本數據進行韻律預測;
所述預先構建文本韻律模型包括:
收集具有對應語音數據的文本數據;
基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據;
利用所述自動標注文本數據訓練文本韻律模型。
優選地,所述基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據包括:
將收集的文本數據與對應的語音數據進行對齊;
根據語音數據的韻律信息在對應的文本數據中插入韻律邊界標識符;
過濾錯誤的韻律邊界標識符,獲取自動標注文本數據。
優選地,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610084393.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種獸醫用放置細胞培養瓶蓋的裝置
- 下一篇:一種干細胞擴增裝置





