[發明專利]語音交互方法、裝置、電子設備和存儲介質在審

申請號：	202011254837.0	申請日：	2020-11-11
公開（公告）號：	CN112382287A	公開（公告）日：	2021-02-19
發明（設計）人：	李循;袁俊	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G10L15/22	分類號：	G10L15/22;G10L15/30;G10L13/04;G10L13/10;G10L25/63
代理公司：	北京清亦華知識產權代理事務所(普通合伙) 11201	代理人：	韓海花
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音交互方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了語音交互方法、裝置、電子設備和存儲介質，涉及自然語言處理、語音技術和深度學習領域。具體實現方案為：獲取用戶語音，根據對用戶語音識別得到的交互上文，從語料庫中確定用于回復交互上文的交互下文，獲取交互下文對應的情感類型，根據情感類型和設定音色，對交互下文進行語音合成，以得到回復語音，采用回復語音進行語音交互。本申請中在對交互下文進行語音合成時，將情感和設定音色融入交互下文，獲取了情感豐富的特定音色的回復語音，提高了語音交互的效果和個性化需求。

技術領域

本申請涉及計算機技術領域，具體涉及自然語言處理、語音技術和深度學習領域，尤其是涉及語音交互方法、裝置、電子設備和存儲介質。

背景技術

隨著語音交互被越來越多用戶所接受，智能助手在用戶日常生活中扮演陪伴的角色越來越重要。在語音交互的過程中，基于語音合成技術將文字信息轉換為可理解的、高擬人化的交互語音。

雖然人工智能的不斷迅速發展，自然語言交互的效率和精準度、智能性也在不斷前進，但現有的產品的對話依舊固定機械化，缺少情感，只能按照預置的固定策略來回答用戶，不能滿足用戶對人機交互的個性化需求，語音交互效果較差。

發明內容

本申請提供了一種用于將情感和音色進行語音合成，以實現個性化語音生成，以提高交互效果的語音交互方法、裝置、電子設備和存儲介質。

根據本申請的一方面，提供了一種語音交互方法，包括：

獲取用戶語音；

根據對用戶語音識別得到的交互上文，從語料庫中確定用于回復所述交互上文的交互下文；

獲取所述交互下文對應的情感類型；

根據所述情感類型和設定音色，對所述交互下文進行語音合成，以得到回復語音；