[發(fā)明專利]語音去噪方法、裝置、電子設備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210067523.2 | 申請日: | 2022-01-20 |
| 公開(公告)號: | CN114360572A | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設計)人: | 方兵曉;劉梁 | 申請(專利權)人: | 百果園技術(新加坡)有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L25/30;H04M1/19 |
| 代理公司: | 北京博遵律師事務所 11761 | 代理人: | 馬佑平 |
| 地址: | 新加坡巴西班讓路*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方法 裝置 電子設備 存儲 介質(zhì) | ||
1.一種語音去噪方法,其特征在于,包括:
對獲取的原始帶噪語音信號進行分幀處理,獲得多個語音幀;
獲取第一語音幀的第一特征信息和第二特征信息,其中,所述第一語音幀為所述多個語音幀中的任意一語音幀,所述第一特征信息包括所述第一語音幀的包絡譜特征,所述第二特征信息包括根據(jù)所述第一語音幀的基音特征得到的特征信息;
根據(jù)所述第一特征信息和所述第二特征信息,獲得所述第一語音幀對應的目標頻點增益;
基于所述目標頻點增益對所述第一語音幀進行去噪處理,以獲得目標語音信號。
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述第一特征信息和所述第二特征信息,獲得所述第一語音幀對應的目標頻點增益,包括:
將所述第一特征信息輸入目標增益預測模型的包絡增強子模型中,通過預測所述第一特征信息中的包絡增益,獲得第一臨界頻帶增益;
將所述第二特征信息輸入所述目標增益預測模型的細節(jié)增強子模型中,通過預測所述第二特征信息中對應頻點處的增益,獲得第一待處理頻點增益;
對所述第一臨界頻帶增益進行上采樣處理,并將進行所述上采樣處理后的第一臨界頻帶增益與所述第一待處理頻率點數(shù)據(jù)進行加和處理,獲得所述目標頻點增益,其中,所述上采樣處理用于對所述第一臨界頻帶增益進行升維處理,以將所述第一臨界頻帶增益升維至與所述第一待處理頻點增益相一致的維度。
3.根據(jù)權利要求2所述的方法,其特征在于,所述包絡增強子模型包括基于循環(huán)神經(jīng)網(wǎng)絡模型結構的網(wǎng)絡模型,所述細節(jié)增強子模型包括基于門控卷積網(wǎng)絡模型結構的網(wǎng)絡模型。
4.根據(jù)權利要求1所述的方法,其特征在于,所述基于所述目標頻點增益對所述第一語音幀進行去噪處理,以獲得目標語音信號,包括:
將所述目標頻點增益與所述第一語音幀的語音頻譜相乘,得到去除噪聲信號的幅度譜數(shù)據(jù);
將所述幅度譜數(shù)據(jù)與所述第一語音幀的相位信息相乘,得到第一結果數(shù)據(jù);
對所述第一結果數(shù)據(jù)進行傅里葉反變換處理,獲得與所述第一語音幀對應的第一去噪語音信號;
根據(jù)所述第一去噪語音信號,獲得所述目標語音信號。
5.根據(jù)權利要求1所述的方法,其特征在于,所述獲取所述第一語音幀的第二特征信息,包括:
提取所述第一語音幀的基音特征;
對所述基音特征進行傅里葉變換處理,將處理得到的所述基音特征的能量譜作為第一子特征信息;
根據(jù)所述第一子特征信息,獲得所述第二特征信息。
6.根據(jù)權利要求5所述的方法,其特征在于,所述獲取所述第一語音幀的第二特征信息,還包括:
對所述第一語音幀進行預設諧波重構處理,獲得第一諧波重構語音信號;
對所述第一諧波重構語音信號進行傅里葉變換處理,獲得第二子特征信息;
對所述第一諧波重構語音信號進行預設處理,并對進行所述預設處理后的第一諧波重構語音信號進行傅里葉變換處理,獲得第三子特征信息;
根據(jù)所述第一子特征信息、所述第二子特征信息和所述第三子特征信息,獲得所述第二特征信息。
7.根據(jù)權利要求6所述的方法,其特征在于,所述對所述第一諧波重構語音信號進行預設處理,包括:
根據(jù)預設函數(shù)映射關系,將所述第一諧波重構語音信號中對應幅值小于預設數(shù)值的信號設置為所述預設數(shù)值。
8.一種語音去噪裝置,其特征在于,包括:
分幀處理模塊,用于對獲取的原始帶噪語音信號進行分幀處理,獲得多個語音幀;
特征提取模塊,用于獲取第一語音幀的第一特征信息和第二特征信息,其中,所述第一語音幀為所述多個語音幀中的任意一語音幀,所述第一特征信息包括所述第一語音幀的包絡譜特征,所述第二特征信息包括根據(jù)所述第一語音幀的基音特征得到的特征信息;
增益預測模塊,用于根據(jù)所述第一特征信息和所述第二特征信息,獲得所述第一語音幀對應的目標頻點增益;
去噪處理模塊,用于基于所述目標頻點增益對所述第一語音幀進行去噪處理,以獲得目標語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百果園技術(新加坡)有限公司,未經(jīng)百果園技術(新加坡)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210067523.2/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種建筑鋼筋除銹裝置
- 下一篇:不影響混凝土性能的機制砂絮凝劑及其制備方法





