[發明專利]一種韻律預測的方法、裝置、設備及存儲介質在審
| 申請號: | 202010970974.8 | 申請日: | 2020-09-15 |
| 公開(公告)號: | CN112216267A | 公開(公告)日: | 2021-01-12 |
| 發明(設計)人: | 吳帥;李健;武衛東;陳明 | 申請(專利權)人: | 北京捷通華聲科技股份有限公司 |
| 主分類號: | G10L13/10 | 分類號: | G10L13/10;G10L13/08;G06F40/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀區東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 韻律 預測 方法 裝置 設備 存儲 介質 | ||
本申請提供了一種韻律預測的方法、裝置、設備及存儲介質,涉及自然語言理解技術領域。從文本語義和文本標點兩方面分析文本語義,再綜合文本語義和文本標點對文本語義的影響,預測該文本的韻律信息,保證在文本本身出現歧義的情況下,能夠準確地預測文本的韻律信息。所述方法包括:獲得待合成文本的語義向量;對所述待合成文本的每個停頓標記進行向量轉換,得到所述待合成文本的標記向量;合并所述語義向量和所述標記向量,得到第一特征向量;將所述第一特征向量輸入預設的韻律預測模型,得到所述待合成文本的韻律信息。
技術領域
本申請涉及自然語言處理技術領域,特別是涉及一種韻律預測的方法、裝置、設備及存儲介質。
背景技術
自然語言處理是指用計算機理解、處理以及運用人類語言(如中文、英文)等,它屬于人工智能的一個分支,是計算機科學與語言學的交叉學科,又常被稱為計算語言學。語音合成,又稱(text to speech)是指利用自然語言處理將文字轉換為能夠合成語音的模擬信號的技術。
語音合成包括文本分析、文本規范化、語音分析、韻律分析等流程。現有技術下,由于韻律預測模型預測發音的韻律的依據較為模糊,導致預測的韻律信息不能準確地反應文本真實表達的意思。
發明內容
本申請實施例提供一種韻律預測的方法、裝置、設備及存儲介質,從文本語義和文本標點兩方面分析文本語義,再綜合文本語義和文本標點對文本語義的影響,預測該文本的韻律信息,保證在文本本身出現歧義的情況下,能夠準確地預測文本的韻律信息。
本申請實施例第一方面提供一種韻律預測的方法,所述方法包括:
獲得待合成文本的語義向量;
對所述待合成文本的每個停頓標記進行向量轉換,得到所述待合成文本的標記向量;
合并所述語義向量和所述標記向量,得到第一特征向量;
將所述第一特征向量輸入預設的韻律預測模型,得到所述待合成文本的韻律信息。
可選地,所述語義向量包括字向量和詞向量;獲得待合成文本的語義向量,包括:
清除所述待合成文本的標點;
對清除標點后的待合成文本的每個文字進行向量轉換,得到所述字向量;
對清除標點后的待合成文本進行分詞,得到多個詞語;
根據每個詞語的組成文字,對所述多個詞語進行向量轉換,得到所述詞向量。
可選地,所述方法還包括:
獲得具有正確標點的文本樣本;
利用第一占位標記替換所述文本樣本中的文字,得到停頓標記樣本;
對所述停頓標記樣本進行向量轉換,得到標記樣本向量;
對所述文本樣本進行韻律標注,得到韻律標記;
清除所述文本樣本中的標點,得到文字樣本;
對所述文字樣本進行向量轉換,得到語義向量樣本;
將所述語義向量樣本輸入第一預設模型,得到中間向量;
將所述中間向量和所述標記樣本向量輸入第二預設模型,得到預測韻律信息;
根據所述預測韻律信息和所述韻律標記的損失函數的取值,對所述第一預設模型和所述第二預設模型分別進行修正;
將修正后的所述第一預設模型和修正后的所述第二預設模型結合,得到所述預設的韻律預測模型。
可選地,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲科技股份有限公司,未經北京捷通華聲科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010970974.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種金屬陶瓷復合部件及其制備方法
- 下一篇:一種氧化溝反硝化脫氮控制系統





