[發明專利]文本處理方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202111350341.8 | 申請日: | 2021-11-15 |
| 公開(公告)號: | CN114091444A | 公開(公告)日: | 2022-02-25 |
| 發明(設計)人: | 李良斌;陳孝良 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06N3/04;G06N3/08;G10L13/08 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 王靜 |
| 地址: | 100094 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 處理 方法 裝置 計算機 設備 存儲 介質 | ||
本申請實施例公開了一種文本處理方法、裝置、計算機設備及存儲介質,屬于計算機技術領域。該方法包括:獲取韻律標注模型,韻律標注模型包括第一識別網絡和標注網絡,第一識別網絡具備識別任一文本中的每個詞語的功能;基于多個第一樣本數據,訓練韻律標注模型;調用訓練后的韻律標注模型,分別對多個第二文本進行標注,得到多個第二樣本數據;基于多個第二樣本數據,訓練韻律預測模型。該方法無需人工標注大量的樣本數據,也能夠訓練出準確的韻律預測模型,在保證韻律預測模型的準確性的同時,降低了人工標注的成本,且提高了標注效率,從而提高了韻律預測模型的訓練效率。
技術領域
本申請實施例涉及計算機技術領域,特別涉及一種文本處理方法、裝置、計算機設備及存儲介質。
背景技術
隨著計算機技術和人工智能技術的發展,基于文本進行語音合成的方式越來越普遍,為了提高合成的語音的播放效果,需要準確地獲取文本中每個詞語的韻律標簽。
相關技術中,調用韻律預測模型對文本進行處理,獲取文本中每個詞語的韻律標簽,但是想要實現準確地預測,需要人工標注大量的文本,采用大量已標注的文本對韻律預測模型進行訓練,導致韻律預測模型的訓練成本較高。
發明內容
本申請實施例提供了一種文本處理方法、裝置、計算機設備及存儲介質,無需人工標注用于訓練韻律預測模型的樣本數據,同時提高了訓練數據的覆蓋率,提高了韻律預測模型的穩定性,并降低了韻律預測模型的訓練成本。所述技術方案如下:
一方面,提供了一種文本處理方法,所述方法包括:
獲取韻律標注模型,所述韻律標注模型包括第一識別網絡和標注網絡,所述第一識別網絡具備識別任一文本中的每個詞語的功能,所述標注網絡用于訓練標注任一文本中至少一個詞語的韻律標簽;
基于多個第一樣本數據,訓練所述韻律標注模型,所述第一樣本數據包括第一文本及所述第一文本中每個詞語的韻律標簽;
調用訓練后的所述韻律標注模型,分別對多個第二文本進行標注,得到多個第二樣本數據,所述第二樣本數據包括第二文本及所述第二文本中每個詞語的韻律標簽,所述多個第一樣本數據的數量小于所述多個第二樣本數據的數量;
基于所述多個第二樣本數據,訓練韻律預測模型。
在一種可能實現方式中,所述基于多個第一樣本數據,訓練所述韻律標注模型,包括:
調用所述第一識別網絡,對所述第一樣本數據中的第一文本進行識別,得到所述第一文本中的多個詞語以及相鄰的每兩個詞語之間的關聯關系;
調用所述標注網絡,基于所述第一文本中相鄰的每兩個詞語之間的關聯關系,對所述第一文本中的多個詞語進行標注,得到所述第一文本中相鄰的每兩個詞語中第一個詞語的預測韻律標簽,以及所述第一文本中最后一個詞語的預測韻律標簽;
基于所述第一文本中每個詞語的韻律標簽以及預測韻律標簽,訓練所述韻律標注模型。
在另一種可能實現方式中,所述調用訓練后的所述韻律標注模型,分別對多個第二文本進行標注,得到多個第二樣本數據,包括:
調用所述第一識別網絡,對所述第二文本進行識別,得到所述第二文本中的多個詞語及相鄰的每兩個詞語之間的關聯關系;
調用所述標注網絡,基于所述第二文本中相鄰的每兩個詞語之間的關聯關系,對所述第二文本中的多個詞語進行標注,得到所述第二文本對應的第二樣本數據。
在另一種可能實現方式中,所述基于所述多個第二樣本數據,訓練韻律預測模型之后,所述方法還包括:
調用訓練后的所述韻律預測模型,對第三文本進行處理,得到所述第三文本中每個詞語的韻律標簽。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111350341.8/2.html,轉載請聲明來源鉆瓜專利網。





