[發明專利]語音活動檢測方法及裝置有效
| 申請號: | 201710578644.2 | 申請日: | 2017-07-14 |
| 公開(公告)號: | CN107393558B | 公開(公告)日: | 2020-09-11 |
| 發明(設計)人: | 蔡鋼林 | 申請(專利權)人: | 深圳永順智信息科技有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 活動 檢測 方法 裝置 | ||
1.一種語音活動檢測方法,其特征在于,包括以下步驟:
計算聲音信號的聽覺特征,所述聽覺特征包括與先驗信噪比相關的第一維度參數、與后驗信噪比相關的第二維度參數、與時域信號相關的第三維度參數;所述聲音信號為數字音頻數據;
將所述第一維度參數、第二維度參數、第三維度參數與各自對應的聽覺閾值比較,獲得檢測結果;
所述第一維度參數以V(1)表示,其由以下公式求得:
其中,γ(k)為先驗信噪比,k為頻率,K為頻帶整體數量;
所述第二維度參數V(2)表示,其由以下公式求得:
其中,ε(k)為后驗信噪比;
所述第三維度參數以V(3)表示,其由以下公式求得:
其中,LW代表窗長,LT代表起始樣本點,函數y為時域混合語音數據,j為時間變量;
所述獲得檢測結果,包括:由所述V(1)、V(1)和V(3)的計算公式,獲得當前聽覺特征計算結果并與聽覺閾值對比,且根據對比結果確定檢測結果來判斷語音有無;
所述判斷語音有無,包括:使用計算檢測結果總和的方式計算檢測結果統計值,并判斷是否誤檢,以及沒有誤檢時對聲音信號進行優化處理。
2.根據權利要求1所述的語音活動檢測方法,其特征在于,所述先驗信噪比γ(k)由以下公式求得:
其中,l為時間幀坐標,Y(l,k)為混合語音頻譜,ΦV(k)代表噪音信號的功率譜密度。
3.根據權利要求2所述的語音活動檢測方法,其特征在于,所述后驗信噪比ε(k)由以下公式求得:
其中,β為平滑因子,β為取值范圍為0.6~0.9,為估算語音頻譜,Max函數表示選擇兩個變量中的最大值。
4.根據權利要求3所述的語音活動檢測方法,其特征在于,
β為0.75。
5.根據權利要求1所述的語音活動檢測方法,其特征在于,所述時域信號以y(t)表示,其由以下公式表示:
其中,x(t)為帶混響語音信號,v(t)為背景噪聲,h(τ)為混響沖擊響應信號,s(t-τ)為無混響語音信號。
6.根據權利要求1所述的語音活動檢測方法,其特征在于,所述聽覺閾值以θT(i)表示,i=1,2,3,θT(1)與所述第一維度參數相對應,θT(2)與所述第二維度參數相對應,θT(3)與所述第三維度參數相對應,θT(i)由以下公式求得:
θ′T(i)為前一幀的聽覺閾值,FB為特征緩沖區矩陣,所述特征緩沖區矩陣由LI個聽覺特征構成,即包括前LI-1幀和當前幀的聽覺特征,i為所述特征緩沖區矩陣的行數,j為所述特征緩沖區矩陣的列數。
7.根據權利要求6所述的語音活動檢測方法,其特征在于,所述FB由以下公式求得:
F’B為前一幀的特征緩沖區矩陣,V(1)為所述第一維度參數,V(2)為所述第二維度參數,V(3)為所述第三維度參數。
8.根據權利要求7所述的語音活動檢測方法,其特征在于,所述將所述第一維度參數、第二維度參數、第三維度參數與各自對應的聽覺閾值比較,獲得檢測結果的步驟中,所述檢測結果由以下公式求得:
q(i)為所述聽覺特征的維度參數的得分,QFrame為語音檢查的判斷結果,判斷結果為1則表明當前幀存在語音,判斷結果為0則表明當前幀不存在語音。
9.一種語音活動檢測裝置,其特征在于,包括:
聽覺特征計算模塊,用于計算聲音信號的聽覺特征,所述聽覺特征包括與先驗信噪比相關的
第一維度參數
與后驗信噪比相關的
第二維度參數
與時域信號相關的
第三維度參數
所述聲音信號為數字音頻數據;
檢測語音模塊,用于將所述第一維度參數,其中,γ(k)為先驗信噪比,k為頻率,K為頻帶整體數量、第二維度參數,其中,ε(k)為后驗信噪比、第三維度參數與各自對應的聽覺閾值比較,獲得檢測結果,其中,LW代表窗長,LT代表起始樣本點,函數y為時域混合語音數據,j為時間變量;所述獲得檢測結果,包括:判斷是否誤檢,以及沒有誤檢時對聲音信號進行優化處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳永順智信息科技有限公司,未經深圳永順智信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710578644.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:車載語音交互裝置及系統
- 下一篇:檢校語音檢測結果的方法及裝置





