[發明專利]語音音頻處理方法、裝置及電子設備在審
| 申請號: | 202111565295.3 | 申請日: | 2021-12-20 |
| 公開(公告)號: | CN114495893A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 許林林 | 申請(專利權)人: | 青島海爾科技有限公司;海爾智家股份有限公司 |
| 主分類號: | G10L13/02 | 分類號: | G10L13/02;G10L15/02;G10L15/08 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 任少瑞 |
| 地址: | 266101 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 音頻 處理 方法 裝置 電子設備 | ||
本發明提供一種語音音頻處理方法、裝置及電子設備,該方法包括:基于目標發音人的目標語料,生成目標發音人對應的目標音頻資源包;在接收到第一電子設備發送的表示請求下載目標音頻資源包的下載請求的情況下,將目標音頻資源包發送至第一電子設備,目標音頻資源包用于生成與目標發音人對應的應答語音;其中,目標音頻資源包包括至少一條語音音頻,語音音頻的播報音色為目標發音人的音色;目標語料包括目標發音人發出的語音形式的語料,目標語料的語料內容包括預先確定的短語、語句、短篇和曲調中的至少一種。本發明提供的語音音頻處理方法、裝置及電子設備,能簡化語音音頻處理的過程,能提高語音音頻處理的效率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種語音音頻處理方法、裝置及電子設備。
背景技術
隨著科學技術的發展,語音交互應用于越來越多的電子設備中,例如:移動通訊第一電子設備、汽車以及智能家居產品等。相較于基于用戶手動操作的交互方式,語音交互的更簡便、使用門檻更低、感官占用更少、輸入效率更高并能傳遞更多的聲學信息,提高了用戶體驗。
通常情況下,具有語音交互功能的電子設備僅能以少數幾個通用音色進行語音播報。在用戶對電子設備進行語音播報的音色有定制化需求的情況下(例如:用戶希望電子設備以某個人的音色進行語音播報),現有技術中可以通過錄制發音人的語音音頻,并基于上述語音音頻和深度學習技術,實現電子設備以上述發音人的音色進行語音播報。但是,為了避免電子設備以上述發音人的音色進行語音播報時音色失真,通常需要采集大量上述發音人的語音音頻用于生成播報音色為上述發音人的音色的應答語音,且對上述語音音頻的音頻質量要求較高,需要投入大量的時間成本,語音音頻處理的效率較低。
發明內容
本發明提供一種語音音頻處理方法、裝置及電子設備,用以解決現有技術中進行語音音頻處理的效率較低的缺陷,實現更高效的語音音頻處理。
本發明提供一種語音音頻處理方法,包括:獲取目標發音人的目標語料;基于所述目標語料,生成所述目標發音人對應的目標音頻資源包;在接收到第一電子設備發送的表示請求下載所述目標音頻資源包的下載請求的情況下,將所述目標音頻資源包發送至第一電子設備,所述目標音頻資源包用于生成與所述目標發音人對應的應答語音;其中,所述目標音頻資源包包括至少一條語音音頻,所述語音音頻的播報音色為所述目標發音人的音色;所述目標語料包括所述目標發音人發出的語音形式的語料,所述目標語料的語料內容包括預先確定的短語、語句、短篇和曲調中的至少一種。
本發明還提供一種語音音頻處理方法,包括:根據接收到的語音指令的聲紋特征,確定所述語音指令對應的目標發音人;在網絡狀態滿足特定條件時,查找與述目標發音人對應的目標音頻資源包;根據所述語音指令的處理結果,從所述目標音頻資源包中確定目標語音音頻,并基于所述處理結果和所述目標語音音頻合成應答語音,并播報所述應答語音。
本發明還提供一種語音音頻處理裝置,包括:語料獲取模塊,用于獲取目標發音人的目標語料;資源包生成模塊,用于基于所述目標語料,生成所述目標發音人對應的目標音頻資源包;資源包發送模塊,用于在接收到第一電子設備發送的表示請求下載所述目標音頻資源包的下載請求的情況下,將所述目標音頻資源包發送至第一電子設備,所述目標音頻資源包用于生成與所述目標發音人對應的應答語音;其中,所述目標音頻資源包包括至少一條語音音頻,所述語音音頻的播報音色為所述目標發音人的音色;所述目標語料包括所述目標發音人發出的語音形式的語料,所述目標語料的語料內容包括預先確定的短語、語句、短篇和曲調中的至少一種。
本發明還提供一種語音音頻處理裝置,包括:通信模塊,用于根據接收到的語音指令的聲紋特征,確定所述語音指令對應的目標發音人;查詢模塊,用于在網絡狀態滿足特定條件時,查找與所述目標發音人對應的目標音頻資源包;播報模塊,用于根據所述語音指令的處理結果,從所述目標音頻資源包中確定目標語音音頻,并基于所述處理結果和所述目標語音音頻合成應答語音,并播報所述應答語音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青島海爾科技有限公司;海爾智家股份有限公司,未經青島海爾科技有限公司;海爾智家股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111565295.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種油煙機控制方法、系統及裝置
- 下一篇:一種電動賽車集成式減速箱





