[發明專利]一種語音增強方法和系統在審

申請號：	202110587365.9	申請日：	2021-05-27
公開（公告）號：	CN115410590A	公開（公告）日：	2022-11-29
發明（設計）人：	肖樂;張承乾;廖風云;齊心	申請（專利權）人：	深圳市韶音科技有限公司
主分類號：	G10L21/0216	分類號：	G10L21/0216
代理公司：	成都七星天知識產權代理有限公司 51253	代理人：	丁曉龍
地址：	518108 廣東省深圳市寶安區石巖***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音增強方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音增強方法，其特征在于，所述方法包括：

獲取目標語音的第一信號和第二信號，所述第一信號為基于第一位置采集的所述目標語音的信號，所述第二信號為基于第二位置采集的所述目標語音的信號；

基于目標語音位置、所述第一位置和所述第二位置，處理所述第一信號和所述第二信號以確定第一系數；

基于所述第一信號和所述第二信號，確定與多個聲源方向有關的多個參數，每個參數對應從一個聲源方向發出聲音以形成所述第一信號和所述第二信號的概率；

基于所述多個參數和所述目標語音位置，確定第二系數；以及

基于所述第一系數和所述第二系數，處理所述第一信號和/或第二信號以獲取所述目標語音對應的語音增強后的第一輸出語音信號。

2.如權利要求1所述的方法，所述基于目標語音位置、所述第一位置和所述第二位置，處理所述第一信號和所述第二信號以確定第一系數，包括：

基于所述目標語音位置、所述第一位置和所述第二位置，對所述第一信號和所述第二信號進行差分運算，獲取指向第一方向的信號和指向第二方向的信號，所述指向第一方向的信號和所述指向第二方向的信號含有不同比例的有效信號；

基于所述指向第一方向的信號和所述指向第二方向的信號，確定與所述有效信號對應的第三信號；以及

基于所述第三信號，確定所述第一系數。

3.如權利要求1所述的方法，所述基于目標語音位置、所述第一位置和所述第二位置，處理所述第一信號和所述第二信號以確定第一系數，包括：

基于所述指向第一方向的信號和所述指向第二方向的信號，確定所述目標語音的估計信噪比；以及

基于所述估計信噪比，確定所述第一系數。

4.如權利要求1所述的方法，所述基于所述第一信號和所述第二信號，確定與多個聲源方向有關的多個參數，包括：

基于每個聲源方向、所述第一位置和所述第二位置，對所述第一信號和所述第二信號進行差分運算，確定與每個聲源方向有關的參數。

5.如權利要求1所述的方法，其特征在于，所述基于所述多個參數和所述目標語音位置，確定第二系數，包括：

基于所述多個參數，確定合成聲源方向；以及

基于所述合成聲源方向和所述目標語音位置，確定所述第二系數。

6.如權利要求1所述方法，其特征在于，所述方法還包括對所述第一信號和所述第二信號執行以下操作中的至少一個：

對所述第一信號和所述第二信號進行分幀；

對所述第一信號和所述第二信號進行加窗平滑；以及

將所述第一信號和所述第二信號轉換到頻域。

7.如權利要求1所述的方法，其特征在于，所述方法進一步包括：

確定所述第一輸出語音信號中至少一個目標子帶信號；以及

基于單麥濾波算法，處理所述至少一個目標子帶信號，獲取第二輸出語音信號。

8.如權利要求1所述的方法，其特征在于，所述方法進一步包括：

基于單麥濾波算法處理所述第一信號和/或所述第二信號，確定第三系數；以及

基于所述第三系數，處理所述第一輸出語音信號，獲取第三輸出語音信號。

9.如權利要求6所述的方法，其特征在于，所述方法還包括：

基于所述第一信號和所述第二信號的能量差，確定第四系數；以及

基于所述第一系數、所述第二系數和所述第四系數，處理所述第一信號和/或第二信號以獲取所述目標語音對應的語音增強后的第四輸出語音信號。

10.一種語音增強系統，其特征在于，包括：

獲取模塊，用于獲取目標語音的第一信號和第二信號，所述第一信號為基于第一位置采集的所述目標語音的信號，所述第二信號為基于第二位置采集的所述目標語音的信號；

處理模塊，用于：

基于目標語音位置、所述第一位置和所述第二位置，處理所述第一信號和所述第二信號以確定第一系數；

基于所述第一信號和所述第二信號，確定與多個聲源方向有關的多個參數，每個參數對應從一個聲源方向發出聲音以形成所述第一信號和所述第二信號的概率；以及

基于所述多個參數和所述目標語音位置，確定第二系數；以及

生成模塊，用于基于所述第一系數和所述第二系數，處理所述第一信號和/或第二信號以獲取所述目標語音對應的語音增強后的第一輸出語音信號。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于深圳市韶音科技有限公司，未經深圳市韶音科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110587365.9/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：信息推薦方法、裝置、電子設備及計算機可讀存儲介質
下一篇：散熱控制方法、散熱控制裝置及存儲介質

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質量或其可識度而處理語音信號，以產生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】