[發明專利]語音合成中的文本處理方法及電子設備在審

申請號：	202210193309.1	申請日：	2022-02-28
公開（公告）號：	CN114664283A	公開（公告）日：	2022-06-24
發明（設計）人：	包鑫彤	申請（專利權）人：	阿里巴巴（中國）有限公司
主分類號：	G10L13/02	分類號：	G10L13/02;G10L13/033;H04L67/30;H04N21/439;H04N21/488;G06F40/166
代理公司：	北京眾達德權知識產權代理有限公司 11570	代理人：	南海燕
地址：	310000 浙江省杭州市濱江***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音合成中的文本處理方法電子設備
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音合成中的文本處理方法，其特征在于，包括：

確定需要進行語音合成的文本內容；

確定所述文本內容中需要增強聲音表現力的目標位置，以及用于在所述目標位置處進行聲音表現力增強的目標聲音素材；

在將所述文本內容轉換為語音合成結果的過程中，將所述目標聲音素材插入到所述目標位置處進行播放。

2.根據權利要求1所述的方法，其特征在于，

所述目標聲音素材是通過對真實人物在目標場景中朗讀目標詞語、短語或語句的過程進行錄制的方式獲得的。

3.根據權利要求1所述的方法，其特征在于，還包括：

讀取配置文件，所述配置文件中包括：多個聲音素材分別對應的匹配規則以及插入位置規則信息；

所述確定所述文本內容中需要增強聲音表現力的目標位置，以及用于在所述目標位置處進行聲音表現力增強的目標聲音素材，包括：

將所述文本內容分割為多個文本片段；

判斷所述文本片段是否符合某聲音素材對應的匹配規則，如果是，則根據該聲音素材對應的插入位置規則信息，確定所述目標位置，并將該聲音素材確定為所述目標聲音素材。

4.根據權利要求3所述的方法，其特征在于，

所述匹配規則包括關鍵詞和/或正則表達式；

所述判斷所述文本片段是否符合某聲音素材對應的匹配規則，包括：

如果所述文本片段中包括某聲音素材對應的關鍵詞和/或符合對應的正則表達式，則確定該文本片段符合該聲音素材對應的匹配規則。

5.根據權利要求3所述的方法，其特征在于，

所述配置文件中還包括：多個聲音素材分別對應的響度和/或停頓時長信息。

6.根據權利要求3所述的方法，其特征在于，

所述配置文件中還包括：多個聲音素材分別對應的規則生效概率信息，以用于對所述聲音素材的插入頻率進行控制。

7.根據權利要求1至6任一項所述的方法，其特征在于，

所述確定所述文本內容中需要增強聲音表現力的目標位置，以及用于在所述目標位置處進行聲音表現力增強的目標聲音素材之后，還包括：

在所述文本內容的所述目標位置處添加表情標簽，所述表情標簽攜帶的信息至少包括：所述目標聲音素材的標識信息；

所述在所述目標位置處插入所述目標聲音素材，包括：

在將所述文本內容轉換為語音合成結果的過程中，根據所述表情標簽加載所述目標聲音素材，并替換到所述目標位置處進行播放。

8.根據權利要求7所述的方法，其特征在于，

所述目標語音素材保存在服務端；

所述根據所述表情標簽加載所述目標聲音素材，并替換到所述目標位置處進行播放，包括：

根據所述表情標簽從所述服務端加載所述目標聲音素材，并替換到所述目標位置處進行播放。

9.根據權利要求1至6任一項所述的方法，其特征在于，

所述文本內容包括：根據需要通過虛擬形象進行語音講解的商品生成的講解文本內容。

10.一種通過虛擬形象進行商品講解的方法，其特征在于，包括：

確定需要通過虛擬形象進行語音講解的商品，并為所述商品生成講解文本內容；

在所述講解文本內容中確定需要增強聲音表現力的目標位置，以及用于在所述目標位置處進行聲音表現力增強的目標聲音素材；

在所述講解文本內容中的所述目標位置處添加表情標簽，所述表情標簽攜帶的信息至少包括：所述目標聲音素材的標識信息；

在將所述講解文本內容轉換為語音合成結果的過程中，根據所述表情標簽加載所述目標聲音素材，并替換到所述目標位置處進行播放。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴（中國）有限公司，未經阿里巴巴（中國）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210193309.1/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：手機屏幕模組檢測內部暗點與表面灰塵區分方法及其系統
下一篇：一種生物質顆粒機故障診斷方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L13-00 語音合成；文本-語音合成系統
G10L13-02 .產生合成語音的方法；語音合成設備
G10L13-06 .語音合成設備中使用的基本語音單位；級聯規則
G10L13-08 .文本分析或文本以外的語音合成參數的產生，例如語義圖翻譯為音素、韻律產生、重音或聲調測定
G10L13-04 ..語音合成系統的零部件，例如合成設備結構或存儲器管理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】