[發(fā)明專利]語音去噪方法、裝置、電子設備及存儲介質(zhì)在審

申請?zhí)枺?/td>	202210067523.2	申請日：	2022-01-20
公開（公告）號：	CN114360572A	公開（公告）日：	2022-04-15
發(fā)明（設計）人：	方兵曉;劉梁	申請（專利權）人：	百果園技術（新加坡）有限公司
主分類號：	G10L21/0232	分類號：	G10L21/0232;G10L25/30;H04M1/19
代理公司：	北京博遵律師事務所 11761	代理人：	馬佑平
地址：	新加坡巴西班讓路***	國省代碼：	暫無信息
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音方法裝置電子設備存儲介質(zhì)
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音去噪方法，其特征在于，包括：

對獲取的原始帶噪語音信號進行分幀處理，獲得多個語音幀；

獲取第一語音幀的第一特征信息和第二特征信息，其中，所述第一語音幀為所述多個語音幀中的任意一語音幀，所述第一特征信息包括所述第一語音幀的包絡譜特征，所述第二特征信息包括根據(jù)所述第一語音幀的基音特征得到的特征信息；

根據(jù)所述第一特征信息和所述第二特征信息，獲得所述第一語音幀對應的目標頻點增益；

基于所述目標頻點增益對所述第一語音幀進行去噪處理，以獲得目標語音信號。

2.根據(jù)權利要求1所述的方法，其特征在于，所述根據(jù)所述第一特征信息和所述第二特征信息，獲得所述第一語音幀對應的目標頻點增益，包括：

將所述第一特征信息輸入目標增益預測模型的包絡增強子模型中，通過預測所述第一特征信息中的包絡增益，獲得第一臨界頻帶增益；

將所述第二特征信息輸入所述目標增益預測模型的細節(jié)增強子模型中，通過預測所述第二特征信息中對應頻點處的增益，獲得第一待處理頻點增益；

對所述第一臨界頻帶增益進行上采樣處理，并將進行所述上采樣處理后的第一臨界頻帶增益與所述第一待處理頻率點數(shù)據(jù)進行加和處理，獲得所述目標頻點增益，其中，所述上采樣處理用于對所述第一臨界頻帶增益進行升維處理，以將所述第一臨界頻帶增益升維至與所述第一待處理頻點增益相一致的維度。

3.根據(jù)權利要求2所述的方法，其特征在于，所述包絡增強子模型包括基于循環(huán)神經(jīng)網(wǎng)絡模型結構的網(wǎng)絡模型，所述細節(jié)增強子模型包括基于門控卷積網(wǎng)絡模型結構的網(wǎng)絡模型。

4.根據(jù)權利要求1所述的方法，其特征在于，所述基于所述目標頻點增益對所述第一語音幀進行去噪處理，以獲得目標語音信號，包括：

將所述目標頻點增益與所述第一語音幀的語音頻譜相乘，得到去除噪聲信號的幅度譜數(shù)據(jù)；

將所述幅度譜數(shù)據(jù)與所述第一語音幀的相位信息相乘，得到第一結果數(shù)據(jù)；

對所述第一結果數(shù)據(jù)進行傅里葉反變換處理，獲得與所述第一語音幀對應的第一去噪語音信號；

根據(jù)所述第一去噪語音信號，獲得所述目標語音信號。

5.根據(jù)權利要求1所述的方法，其特征在于，所述獲取所述第一語音幀的第二特征信息，包括：

提取所述第一語音幀的基音特征；

對所述基音特征進行傅里葉變換處理，將處理得到的所述基音特征的能量譜作為第一子特征信息；

根據(jù)所述第一子特征信息，獲得所述第二特征信息。

6.根據(jù)權利要求5所述的方法，其特征在于，所述獲取所述第一語音幀的第二特征信息，還包括：

對所述第一語音幀進行預設諧波重構處理，獲得第一諧波重構語音信號；

對所述第一諧波重構語音信號進行傅里葉變換處理，獲得第二子特征信息；

對所述第一諧波重構語音信號進行預設處理，并對進行所述預設處理后的第一諧波重構語音信號進行傅里葉變換處理，獲得第三子特征信息；

根據(jù)所述第一子特征信息、所述第二子特征信息和所述第三子特征信息，獲得所述第二特征信息。

7.根據(jù)權利要求6所述的方法，其特征在于，所述對所述第一諧波重構語音信號進行預設處理，包括：

根據(jù)預設函數(shù)映射關系，將所述第一諧波重構語音信號中對應幅值小于預設數(shù)值的信號設置為所述預設數(shù)值。

8.一種語音去噪裝置，其特征在于，包括：

分幀處理模塊，用于對獲取的原始帶噪語音信號進行分幀處理，獲得多個語音幀；

特征提取模塊，用于獲取第一語音幀的第一特征信息和第二特征信息，其中，所述第一語音幀為所述多個語音幀中的任意一語音幀，所述第一特征信息包括所述第一語音幀的包絡譜特征，所述第二特征信息包括根據(jù)所述第一語音幀的基音特征得到的特征信息；

增益預測模塊，用于根據(jù)所述第一特征信息和所述第二特征信息，獲得所述第一語音幀對應的目標頻點增益；

去噪處理模塊，用于基于所述目標頻點增益對所述第一語音幀進行去噪處理，以獲得目標語音信號。

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于百果園技術（新加坡）有限公司，未經(jīng)百果園技術（新加坡）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210067523.2/1.html，轉載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種建筑鋼筋除銹裝置
下一篇：不影響混凝土性能的機制砂絮凝劑及其制備方法

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L21-00 為了改變語音信號的質(zhì)量或其可識度而處理語音信號，以產(chǎn)生另一種可聽的或非可聽的信號，例如視覺信號或觸覺信號
G10L21-02 .語音增強，例如降低噪聲或消除回聲
G10L21-04 .時間壓縮或擴展
G10L21-06 .將語音轉換成非可聽表達形式，例如語音可視化、觸覺輔助的語音處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】