[發明專利]語音處理方法及裝置有效

申請號：	201710578504.5	申請日：	2017-07-14
公開（公告）號：	CN107393550B	公開（公告）日：	2021-03-19
發明（設計）人：	蔡鋼林	申請（專利權）人：	深圳永順智信息科技有限公司
主分類號：	G10L21/0232	分類號：	G10L21/0232;G10L21/0208;G10L25/21;G10L15/20
代理公司：	深圳市明日今典知識產權代理事務所(普通合伙) 44343	代理人：	王杰輝
地址：	518000 廣東省深圳市***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種語音處理方法，其特征在于，包括以下步驟：

將聲音信號從時域變換到頻域，獲得頻域信號，計算所述頻域信號的觀測信號功率譜密度，并根據所述觀測信號功率譜密度估算噪音功率譜密度；

構建多參量的聽覺特征，所述參量與所述聲音信號、先驗信噪比、后驗信噪比相關，所述聽覺特征包括：

其中，γ(k)為先驗信噪比，ε(k)為后驗信噪比，L_W代表窗長，L_T代表起始樣本點，k為頻率坐標，K代表頻帶整體的數量；

使用所述聽覺特征中的參量分別與各自對應的聽覺閾值比較；

若任一參量大于與其對應的聽覺閾值，則判定所述聲音信號存在語音活動；

在判斷出所述聲音信號存在語音活動時，使用自適應Kalman濾波處理所述頻域信號，獲得混響功率譜密度；

根據所述噪音功率譜密度、混響功率譜密度、觀測信號功率譜密度計算去除噪音和混響的頻域信號，記為優化估算語音頻譜；

使用逆傅里葉變換將所述優化估算語音頻譜從頻域恢復為時域，獲得優化后的聲音信號。

2.根據權利要求1所述語音處理方法，其特征在于，所述估算噪音功率譜密度的步驟，包括：

假定前L_I時間幀沒有語音活動，初始化噪音功率譜密度、估算語音頻譜、觀測信號功率譜密度、先驗信噪比、后驗信噪比；

從第L_I+1時間幀開始做迭代計算，更新觀測信號功率譜密度，具體為：

Φ_Y(k)＝αΦ′_Y(k)+(1-α)|Y(l,k)|²

其中，α為第一平滑因子，Φ_Y(k)為觀測信號功率譜密度，Φ′_Y(k)為前一幀的觀測信號功率譜密度，Y(l,k)為所述頻域信號；l為時間幀坐標，k為頻率坐標；

計算先驗信噪比和后驗信噪比：

其中，β為第二平滑因子，γ(k)為先驗信噪比，ε(k)為后驗信噪比，Φ_V(k)為噪音功率譜密度，為估算語音頻譜；

根據所述先驗信噪比和后驗信噪比，計算噪音功率譜的自適應更新步長：

根據所述自適應更新步長，更新噪音功率譜，具體為：

Φ_V(k)＝α_V(k)Φ′_V(k)+(1-α_V(k))|Y(l,k)|²。

3.根據權利要求2所述語音處理方法，其特征在于，所述假定前L_I時間幀沒有語音活動，初始化噪音功率譜密度、估算語音頻譜、觀測信號功率譜密度、先驗信噪比、后驗信噪比的步驟，具體為：

γ(k)＝1,ε(k)＝κ,k＝1,2,…，K

其中，K代表頻帶整體的數量，κ為第一衰減因子。

4.根據權利要求2所述語音處理方法，其特征在于，所述α的取值范圍為[0.95，0.98)、0.98或(0.98，0.995]，所述β的取值范圍為[0.6，0.75)、0.75或(0.75，0.9]。

5.根據權利要求1所述語音處理方法，其特征在于，所述自適應Kalman濾波是指用一個前向預測濾波器，對純凈語音頻譜進行預測。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于深圳永順智信息科技有限公司，未經深圳永順智信息科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710578504.5/1.html，轉載請聲明來源鉆瓜專利網。

專利分類

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】