[發明專利]一種基于性別融合信息的語音降噪方法有效
| 申請號: | 201710139644.2 | 申請日: | 2017-03-09 |
| 公開(公告)號: | CN108573698B | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 李軍鋒;李煦;顏永紅 | 申請(專利權)人: | 中國科學院聲學研究所 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20 |
| 代理公司: | 北京方安思達知識產權代理有限公司 11472 | 代理人: | 王宇楊;陳琳琳 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 性別 融合 信息 語音 方法 | ||
1.一種基于性別融合信息的語音降噪方法,所述方法包括:
步驟1)采集大量語音訓練數據,訓練得到男性說話人DNN-NMF模型和女性說話人DNN-NMF模型;
步驟2)提取測試語音的頻譜,確定測試語音說話人的性別;
步驟3)根據步驟2)確定的性別,將測試語音的幅度譜輸入相應的DNN-NMF模型,得到降噪后的語音;
所述步驟2)具體包括:
步驟201)對測試語音進行預處理,提取其頻譜;
步驟202)根據測試語音幅度譜X,利用性別鑒定算法確定測試語音說話人的性別;
所述步驟202)具體包括:
步驟202-1)對測試語音幅度譜X進行無監督非負矩陣分解,解決如下最優化問題:
其中,W=[Ws WN],H=[HST HNT]T,以及
目標函數的第二項為稀疏懲罰函數,β為系數,ε1為系數;
在進行分解時,步驟202-1)具體包括:
步驟202-1-1)計算X和WH的相似度V:
V=X./(WH)
其中,./表示逐點相除;
步驟202-1-2)更新權重向量H:
其中,.*表示逐點相乘;
步驟202-1-3)對中的語音權重矩陣HS進行稀懲罰,更新
λ2和ε2為系數;
步驟202-1-4)更新噪聲矩陣WN,并對其進行歸一化:
步驟202-1-5)判斷步驟202-1-4)是否收斂;如果判斷結果是肯定的,轉入步驟202-2);否則,令轉入步驟202-1-1);
步驟202-2)通過比較權重矩陣和的大小判斷該說話人的性別;
如果||·||1表示矩陣的第一范式;判斷該說話人為男性,反之則判斷為女性。
2.根據權利要求1所述的基于性別融合信息的語音降噪方法,其特征在于,所述步驟1)具體包括:
步驟101)采集大量語音訓練數據,所述語音訓練數據包括:不含噪聲的語音訓練數據和純噪聲語音訓練數據;
步驟102)對語音訓練數據進行預處理,然后通過快速傅里葉變換提取語音訓練數據的頻譜;
步驟103)對不含噪聲的語音訓練數據按照性別進行分類:男性說話人訓練數據和女性說話人訓練數據,然后分別對男性說話人訓練數據幅度譜和女性說話人訓練數據幅度譜進行非負矩陣分解:
從中得到男性說話人和女性說話人對應的字典矩陣和
步驟104)對純噪聲語音訓練數據的幅度譜進行非負矩陣分解,得到噪聲字典WN;
步驟105)訓練女性說話人DNN-NMF模型;
步驟106)訓練男性說話人DNN-NMF模型。
3.根據權利要求2所述的基于性別融合信息的語音降噪方法,其特征在于,所述步驟105)具體包括:
步驟105-1)隨機初始化女性說話人DNN-NMF模型參數;
步驟105-2)將不含噪聲的女性說話人訓練數據和純噪聲訓練數據進行混合,形成混合訓練數據,對混合訓練數據進行快速傅里葉變換,提取其幅度譜,作為女性說話人DNN-NMF模型的輸入x;
步驟105-3)根據前向傳播算法計算女性說話人DNN-NMF模型最終的目標函數:
其中,xS是步驟105-2)中的不含噪聲的女性說話人訓練數據的幅度譜,xN是步驟105-2)中的純噪聲訓練數據的幅度譜,和是DNN模型的輸出,表示NMF的權重向量,通過DNN前向傳播算法得到,是模型的一個中間變量,用于和字典相乘重構語音和噪聲信號;λ1為系數;
步驟105-4)計算步驟105-3)中目標函數關于女性說話人DNN-NMF模型參數的導數,然后采用后向傳播算法估計女性說話人DNN-NMF的參數,參數包括模型層與層之間的權重矩陣和偏置向量,得到女性說話人的DNN-NMF模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所,未經中國科學院聲學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710139644.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語言模型更新方法、裝置及設備
- 下一篇:語音共享識別方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





