[發明專利]文本的切分方法和文本的切分裝置在審
| 申請號: | 202210344456.4 | 申請日: | 2022-03-31 |
| 公開(公告)號: | CN114678002A | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 高羽;涂建華 | 申請(專利權)人: | 美的集團(上海)有限公司;美的集團股份有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L13/08;G10L13/10;G10L13/06 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 鄭朝然 |
| 地址: | 201700 上海市青浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 切分 方法 裝置 | ||
本申請涉及語音合成領域,提供一種文本的切分方法和文本的切分裝置,所述文本的切分方法,包括:將目標文本轉化為韻律音素序列,所述韻律音素序列包括與所述目標文本對應的多個音素以及位于相鄰所述音素之間的韻律標識符;基于多個所述韻律標識符在所述韻律音素序列中確定第一切分位置;基于所述第一切分位置對所述韻律音素序列進行切分,生成第一子韻律音素序列和第二子韻律音素序列,且所述第一子韻律音素序列對應的語音合成時長在目標時長內。本申請的文本的切分方法,能夠縮短合成系統的首句響應時間。
技術領域
本申請涉及語音合成技術領域,尤其涉及文本的切分方法和文本的切分裝置。
背景技術
從文本到語音(Text To Speech,TTS)技術被廣泛應用于語音合成領域。在進行文本切分時,常用的方法為基于標點符號來對文本進行切分,但該切分方法既無法解決無標點符號的文本的切分,也無法解決切分后兩端不均衡的問題。
發明內容
本申請旨在至少解決現有技術中存在的技術問題之一。為此,本申請提出一種文本的切分方法。
本申請還提出一種文本的切分裝置。
本申請還提出一種電子設備。
本申請還提出一種非暫態計算機可讀存儲介質。
本申請還提出一種計算機程序產品。
根據本申請第一方面實施例的文本的切分方法,包括:
將目標文本轉化為韻律音素序列,所述韻律音素序列包括與所述目標文本對應的多個音素以及位于相鄰所述音素之間的韻律標識符;
基于多個所述韻律標識符在所述韻律音素序列中確定第一切分位置;
基于所述第一切分位置對所述韻律音素序列進行切分,生成第一子韻律音素序列和第二子韻律音素序列,所述第一子韻律音素序列為所述韻律音素序列中位于所述第一切分位置之前的韻律音素序列,所述第二子韻律音素序列為所述韻律音素序列中位于所述第一切分位置之后的韻律音素序列,且所述第一子韻律音素序列對應的語音合成時長在目標時長內。
根據本申請實施例的文本的切分方法,通過第一子韻律音素序列所對應的語音合成時長來確定用于切分得到第一子韻律音素序列的第一切分位置,以使第一子韻律音素序列對應的語音合成時長能夠在合理的時長范圍內,從而縮短合成系統的首句響應時間。
根據本申請的一個實施例,所述基于多個所述韻律標識符在所述韻律音素序列中確定第一切分位置,包括:
基于目標閾值范圍,從所述多個韻律標識符中確定細粒度最大的所述韻律標識符;
將所述細粒度最大的所述韻律標識符在所述韻律音素序列中的位置確定為所述第一切分位置。
根據本申請的一個實施例,所述基于目標閾值范圍,從所述多個韻律標識符中確定細粒度最大的所述韻律標識符,包括:
獲取所述韻律音素序列中目標子韻律音素序列全部音素的第一發音長度,所述目標子韻律音素序列為所述韻律音素序列中在目標位置之前的全部韻律音素序列;
確定所述第一發音長度在所述目標閾值范圍內,且確定所述第一發音長度對應的目標位置處的所述韻律標識符為第一次出現,將所述第一發音長度對應的目標位置確定為候選切分點位置,生成多個所述候選切分點位置;
從所述多個所述候選切分點位置所對應的韻律標識符中確定細粒度最大的韻律標識符。
根據本申請的一個實施例,在所述生成第一子韻律音素序列和第二子韻律音素序列之后,所述方法還包括:
對所述第一子韻律音素序列進行語音合成,生成第一語音;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于美的集團(上海)有限公司;美的集團股份有限公司,未經美的集團(上海)有限公司;美的集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210344456.4/2.html,轉載請聲明來源鉆瓜專利網。





