[發明專利]語音合成方法、裝置、設備和介質有效

申請號：	202010544845.2	申請日：	2020-06-15
公開（公告）號：	CN111667811B	公開（公告）日：	2021-09-07
發明（設計）人：	崔璐	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G10L13/02	分類號：	G10L13/02;G10L25/63;G10L25/51;G06F40/30;G06F40/295
代理公司：	北京品源專利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音合成方法裝置設備介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例公開了一種語音合成方法、裝置、設備和介質，涉及語音技術、自然語言處理技術和深度學習技術。其中，該語音合成方法包括：獲取目標對白語句，并確定目標對白語句涉及的目標人物角色；基于目標對白語句，確定目標人物角色的描述信息；其中，描述信息包括人設標簽、角色關系、角色身份和對話場景中的至少一種；利用目標對白語句和目標人物角色的描述信息，確定目標人物角色的角色情感；如果滿足語音合成觸發條件，則依據目標人物角色和目標人物角色的角色情感，對目標對白語句進行語音合成。本申請實施例可以提高語音播報的角色代入感、畫面感。

技術領域

本申請實施例涉及計算機技術，具體涉及語音技術、自然語言處理技術和深度學習技術，尤其涉及一種語音合成方法、裝置、設備和介質。

背景技術

語音合成技術的發展，不經為人們日常生活帶來極大的便利性，例如支持語音交互的智能家電被普遍推廣，同時，也改變了人們觀看電子書的方式。越來越多的電子書產品支持文本的語音播報，聽書成為人們利用碎片時間看書的一種新方式。

然而，目前大多數電子書的語音播報，播報語音較為單一，且語音的情感表現力不足，不能為聽眾從視覺上帶來角色畫面感，也無法引起聽眾對角色的代入感。

發明內容

本申請實施例提供了一種語音合成方法、裝置、設備和介質，以提高語音播報的角色代入感、畫面感。

根據本申請實施例的一方面，提供了一種語音合成方法，包括：

獲取目標對白語句，并確定所述目標對白語句涉及的目標人物角色；

基于所述目標對白語句，確定所述目標人物角色的描述信息；其中，所述描述信息包括人設標簽、角色關系、角色身份和對話場景中的至少一種；

利用所述目標對白語句和所述目標人物角色的描述信息，確定所述目標人物角色的角色情感；

如果滿足語音合成觸發條件，則依據所述目標人物角色和所述目標人物角色的角色情感，對所述目標對白語句進行語音合成。