[發明專利]一種語音處理方法、裝置、介質機計算機設備在審
| 申請號: | 202110961456.4 | 申請日: | 2021-08-20 |
| 公開(公告)號: | CN115910089A | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 毛鑫 | 申請(專利權)人: | 武漢斗魚網絡科技有限公司 |
| 主分類號: | G10L21/0216 | 分類號: | G10L21/0216;G10L25/30 |
| 代理公司: | 北京眾達德權知識產權代理有限公司 11570 | 代理人: | 姚萱萱 |
| 地址: | 430000 湖北省武漢市東湖開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 處理 方法 裝置 介質 計算機 設備 | ||
1.一種語音處理方法,其特征在于,所述方法包括:
獲取初始帶噪語音信號,對所述初始帶噪語音信號進行卷積并激活,獲得第一帶噪語音信號;
對所述第一帶噪語音信號進行歸一化、卷積處理,獲得第二帶噪語音信號;
利用多尺度卷積神經網絡對所述第二帶噪語音信號進行多尺度特征融合,獲得第三帶噪語音信號;每個尺度特征融合對應的擴張因子不同;
對所述第一帶噪語音信號及所述第三帶噪語音信號進行疊加,獲得第四帶噪語音信號;
對所述第四帶噪語音信號進行處理,獲得噪聲高維嵌入向量及降噪高維嵌入向量;
對所述噪聲高維嵌入向量及降噪高維嵌入向量進行處理,獲得分離噪聲及分離語音。
2.如權利要求1所述的方法,其特征在于,所述對所述第一帶噪語音信號進行歸一化、卷積處理,獲得第二帶噪語音信號,包括:
利用公式對所述第一帶噪語音信號進行歸一化處理,獲得歸一化帶噪語音信號outputk1;
對所述歸一化帶噪語音信號進行1×1卷積,獲得所述第二帶噪語音信號;其中,
所述inputk1為所述第一帶噪語音信號的第k1幀信號;所述E(inputk1)為第k1幀信號輸入時,各幀信號的期望值;所述Var(inputk1)為第k1幀信號輸入時,各幀信號的方差;所述ε為常量,所述ε取值范圍為10-8~10-5;所述γ為第一訓練參數,所述β為第二訓練參數。
3.如權利要求1所述的方法,其特征在于,所述利用多尺度卷積神經網絡對所述第二帶噪語音信號進行多尺度特征融合,獲得第三帶噪語音信號,包括:
利用預設數量的卷積模塊分別對所述第二帶噪語音信號進行1×1卷積,獲得相應數量的第一卷積信號:
分別對各所述第一卷積信號進行激活及歸一化處理,獲得相應數量的歸一化信號;
基于深度分離擴張因果卷積模塊對應的擴張因子,對各所述歸一化信號進行一次深度分離擴張因果卷積,獲得對應的第二卷積信號;
將每個所述第二卷積信號進行連接,獲得連接帶噪語音信號;
對所述連接帶噪語音信號依次進行激活、通道歸一化處理及1×1卷積后,獲得所述第三帶噪語音信號。
4.如權利要求1所述的方法,其特征在于,所述對所述第四帶噪語音信號進行處理,獲得噪聲高維嵌入向量及降噪高維嵌入向量,包括:
對所述第四帶噪語音信號進行n-1次深度分離擴張因果卷積,獲得第三卷積信號;
對所述第三卷積信號進行1×1卷積,獲得第四卷積信號;
利用Relu激活函數對所述第四卷積信號進行處理,獲得噪聲比值膜及語音比值膜;
將所述噪聲比值膜與所述第一帶噪語音信號相乘,獲得所述噪聲高維嵌入向量;
將所述語音比值膜與所述第一帶噪語音信號相乘,獲得所述降噪高維嵌入向量;其中,所述n為深度分離擴張因果卷積模塊的總數量。
5.如權利要求1所述的方法,其特征在于,所述對所述噪聲高維嵌入向量及降噪高維嵌入向量進行處理,獲得分離噪聲及分離語音,包括:
利用公式outputk2=inputk2·V對所述噪聲高維嵌入向量進行全連接處理,獲得第一全連接噪聲信號outputk2;
利用公式outputk3=inputk3·V對所述降噪高維嵌入向量進行全連接處理,獲得第二全連接噪聲信號outputk3;
對所述第一全連接噪聲信號及所述第二全連接噪聲信號進行重構,獲得所述分離噪聲及所述分離語音;其中,所述V為全連接矩陣,所述inputk2為所述噪聲高維嵌入向量,所述inputk3為所述降噪高維嵌入向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢斗魚網絡科技有限公司,未經武漢斗魚網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110961456.4/1.html,轉載請聲明來源鉆瓜專利網。





