[發明專利]語音增強方法、裝置、設備及存儲介質有效

申請號：	202010615254.X	申請日：	2020-06-30
公開（公告）號：	CN111785288B	公開（公告）日：	2022-03-15
發明（設計）人：	鄧承韻;宋輝;沙永濤;張毅	申請（專利權）人：	北京嘀嘀無限科技發展有限公司
主分類號：	G10L21/02	分類號：	G10L21/02;G10L25/30;G06N3/04;G06N3/08
代理公司：	北京同立鈞成知識產權代理有限公司 11205	代理人：	張娜;臧建明
地址：	100193 北京***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音增強方法裝置設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本公開的實施例提供一種語音增強方法、裝置、設備及存儲介質。該方法包括：獲取目標語音；確定目標語音所在場景的場景類型；在預設的各語音增強模型中，選取與場景類型對應的語音增強模型；通過與場景類型對應的語音增強模型，對目標語音進行增強。本公開的實施例的方法，提供了語音增強的靈活性，使得語音增強的使用場景更廣泛，同時確保各個場景下的語音增強效果。

技術領域

本公開的實施例涉及語音處理領域，尤其涉及一種語音增強方法、裝置、設備及存儲介質。

背景技術

語音增強是指對語音信號進行降噪處理，以提高語音信號的質量。

通常的，在硬件方面，有通過多個麥克風采集來自不同方向的語音來提高語音增強效果的方式，在軟件方面，有通過深度學習技術來提高語音信號效果的方式。

然而，上述方式更多的是側重于提高語音去噪程度，未充分考慮到語音增強的實際場景。

發明內容

本公開的實施例提供一種語音增強方法、裝置、設備及存儲介質，用以解決現有的語音增強方式未充分考慮語音增強的實際場景，導致語音增強效果不佳的問題。

第一方面，本公開的實施例提供一種語音增強方法，包括：

獲取目標語音；

確定所述目標語音所在場景的場景類型；

在預設的各語音增強模型中，選取與所述場景類型對應的語音增強模型；

通過與所述場景類型對應的語音增強模型，對所述目標語音進行增強。

第二方面，本公開的實施例提供一種語音增強裝置，包括：

獲取模塊，用于獲取目標語音；

確定模塊，用于確定所述目標語音所在場景的場景類型；

選取模塊，用于在預設的各語音增強模型中，選取與所述場景類型對應的語音增強模型；

增強模塊，用于通過與所述場景類型對應的語音增強模型，對所述目標語音進行增強。

第三方面，本公開的實施例提供了一種電子設備，包括：

存儲器和處理器；

所述存儲器用于存儲程序指令；

所述處理器用于調用所述存儲器中的程序指令執行如上述第一方面所述的方法。

第四方面，本公開的實施例提供了一種計算機可讀存儲介質，其上存儲有計算機程序，所述計算機程序被執行時，實現如上述第一方面所述的方法。

第五方面，本公開的實施例提供一種包含指令的程序產品，所述程序產品包括計算機程序，所述計算機程序被處理器執行時實現如第一方面所述的方法。

本公開的實施例提供的語音增強方法、裝置、設備及存儲介質，確定目標語音所在場景的場景類型，確定與該場景類型對應的語音增強模型，通過與該場景類型對應的語音增強模型，對目標語音進行語音增強。因此，依據目標語音所在場景，有針對性地對目標語音進行語音增強，以適應不同場景對語音增強的要求，提高了語音增強的靈活性，使得語音增強的適用場景更廣泛，同時確保不同場景下的語音增強效果。

本公開的各種可行實施例及其技術優勢將在下文詳述。

附圖說明

此處的附圖被并入說明書中并構成本說明書的一部分，示出了符合本公開的實施例，并與說明書一起用于解釋本公開的原理。

圖1為本公開的一實施例提供的網絡架構示意圖；

圖2為本公開的一實施例提供的語音增強方法的流程示意圖；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京嘀嘀無限科技發展有限公司，未經北京嘀嘀無限科技發展有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010615254.X/2.html，轉載請聲明來源鉆瓜專利網。