[發明專利]一種韻律預測方法及系統有效
| 申請號: | 201610084393.8 | 申請日: | 2016-02-04 |
| 公開(公告)號: | CN107039034B | 公開(公告)日: | 2020-05-01 |
| 發明(設計)人: | 周明;江源;胡國平;胡郁;劉慶峰 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 周放;江懷勤 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 韻律 預測 方法 系統 | ||
1.一種韻律預測方法,其特征在于,包括:
預先構建文本韻律模型;
接收待預測文本數據;
提取待預測文本數據的文本特征;
利用所述文本特征及所述文本韻律模型,對所述待預測文本數據進行韻律預測;
所述預先構建文本韻律模型包括:
收集具有對應語音數據的文本數據;
基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據,包括通過以下任一個或多個方式對自動韻律標注結果進行過濾:根據發音人的語速過濾韻律邊界標識符;根據詞邊界檢測結果過濾韻律邊界標識符;過濾間距小于設定閾值的韻律邊界標識符;
利用所述自動標注文本數據訓練文本韻律模型。
2.根據權利要求1所述的方法,其特征在于,所述基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據包括:
將收集的文本數據與對應的語音數據進行對齊;
根據語音數據的韻律信息在對應的文本數據中插入韻律邊界標識符;
過濾錯誤的韻律邊界標識符,獲取自動標注文本數據。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
將收集的文本數據與對應的語音數據進行對齊之前,刪除文本數據中亂碼及特殊字符。
4.根據權利要求2所述的方法,其特征在于,所述根據語音數據的韻律信息在對應的文本數據中插入韻律邊界標識符包括:
以字為單位,獲取與語音數據對應的文本數據中各字的停頓時長;
在停頓時長超過預設閾值的字之后插入韻律邊界標識符。
5.根據權利要求2所述的方法,其特征在于,所述過濾錯誤的韻律邊界標識符,獲取自動標注文本數據包括:
對語音數據進行端點檢測,根據端點檢測結果過濾韻律邊界標識符。
6.根據權利要求1至5任一項所述的方法,其特征在于,所述方法還包括:
預先收集人工標注文本數據,所述人工標注文本數據為具有人工標注的韻律邊界信息的文本數據;
利用所述自動標注文本數據訓練文本韻律模型之后,利用所述人工標注文本數據對自動標注文本數據訓練的文本韻律模型進行再次訓練,優化所述文本韻律模型;
所述利用所述文本特征及所述文本韻律模型,對所述待預測文本數據進行韻律預測包括:
利用所述文本特征及優化后文本韻律模型,對所述待預測文本數據進行韻律預測。
7.根據權利要求1至5任一項所述的方法,其特征在于,所述文本韻律模型采用深度神經網絡結構。
8.一種韻律預測系統,其特征在于,包括:
模型構建模塊,用于預先構建文本韻律模型;
接收模塊,用于接收待預測文本數據;
特征提取模塊,用于提取待預測文本數據的文本特征;
韻律預測模塊,用于利用所述文本特征及所述文本韻律模型,對所述待預測文本數據進行韻律預測;
所述模型構建模塊包括:
收集單元,用于收集具有對應語音數據的文本數據;
標注單元,用于基于語音數據的韻律信息對對應的文本數據進行自動韻律標注,獲取自動標注文本數據,包括通過以下任一個或多個方式對自動韻律標注結果進行過濾:根據發音人的語速過濾韻律邊界標識符;根據詞邊界檢測結果過濾韻律邊界標識符;過濾間距小于設定閾值的韻律邊界標識符;
訓練單元,用于利用所述自動標注文本數據訓練文本韻律模型。
9.根據權利要求8所述的系統,其特征在于,所述標注單元包括:
對齊子單元,用于將收集的文本數據與對應的語音數據進行對齊;
標注子單元,用于根據語音數據的韻律信息在對應的文本數據中插入韻律邊界標識符;
濾錯子單元,用于過濾錯誤的韻律邊界標識符,獲取自動標注文本數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610084393.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種獸醫用放置細胞培養瓶蓋的裝置
- 下一篇:一種干細胞擴增裝置





