[發明專利]語音處理方法及裝置有效
| 申請號: | 201710578504.5 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107393550B | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 蔡鋼林 | 申請(專利權)人: | 深圳永順智信息科技有限公司 |
| 主分類號: | G10L21/0232 | 分類號: | G10L21/0232;G10L21/0208;G10L25/21;G10L15/20 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 | ||
1.一種語音處理方法,其特征在于,包括以下步驟:
將聲音信號從時域變換到頻域,獲得頻域信號,計算所述頻域信號的觀測信號功率譜密度,并根據所述觀測信號功率譜密度估算噪音功率譜密度;
構建多參量的聽覺特征,所述參量與所述聲音信號、先驗信噪比、后驗信噪比相關,所述聽覺特征包括:
其中,γ(k)為先驗信噪比,ε(k)為后驗信噪比,LW代表窗長,LT代表起始樣本點,k為頻率坐標,K代表頻帶整體的數量;
使用所述聽覺特征中的參量分別與各自對應的聽覺閾值比較;
若任一參量大于與其對應的聽覺閾值,則判定所述聲音信號存在語音活動;
在判斷出所述聲音信號存在語音活動時,使用自適應Kalman濾波處理所述頻域信號,獲得混響功率譜密度;
根據所述噪音功率譜密度、混響功率譜密度、觀測信號功率譜密度計算去除噪音和混響的頻域信號,記為優化估算語音頻譜;
使用逆傅里葉變換將所述優化估算語音頻譜從頻域恢復為時域,獲得優化后的聲音信號。
2.根據權利要求1所述語音處理方法,其特征在于,所述估算噪音功率譜密度的步驟,包括:
假定前LI時間幀沒有語音活動,初始化噪音功率譜密度、估算語音頻譜、觀測信號功率譜密度、先驗信噪比、后驗信噪比;
從第LI+1時間幀開始做迭代計算,更新觀測信號功率譜密度,具體為:
ΦY(k)=αΦ′Y(k)+(1-α)|Y(l,k)|2
其中,α為第一平滑因子,ΦY(k)為觀測信號功率譜密度,Φ′Y(k)為前一幀的觀測信號功率譜密度,Y(l,k)為所述頻域信號;l為時間幀坐標,k為頻率坐標;
計算先驗信噪比和后驗信噪比:
其中,β為第二平滑因子,γ(k)為先驗信噪比,ε(k)為后驗信噪比,ΦV(k)為噪音功率譜密度,為估算語音頻譜;
根據所述先驗信噪比和后驗信噪比,計算噪音功率譜的自適應更新步長:
根據所述自適應更新步長,更新噪音功率譜,具體為:
ΦV(k)=αV(k)Φ′V(k)+(1-αV(k))|Y(l,k)|2。
3.根據權利要求2所述語音處理方法,其特征在于,所述假定前LI時間幀沒有語音活動,初始化噪音功率譜密度、估算語音頻譜、觀測信號功率譜密度、先驗信噪比、后驗信噪比的步驟,具體為:
γ(k)=1,ε(k)=κ,k=1,2,…,K
其中,K代表頻帶整體的數量,κ為第一衰減因子。
4.根據權利要求2所述語音處理方法,其特征在于,所述α的取值范圍為[0.95,0.98)、0.98或(0.98,0.995],所述β的取值范圍為[0.6,0.75)、0.75或(0.75,0.9]。
5.根據權利要求1所述語音處理方法,其特征在于,所述自適應Kalman濾波是指用一個前向預測濾波器,對純凈語音頻譜進行預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳永順智信息科技有限公司,未經深圳永順智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710578504.5/1.html,轉載請聲明來源鉆瓜專利網。





