[發明專利]語音活動檢測方法及裝置、可讀存儲介質有效
| 申請號: | 201910184966.8 | 申請日: | 2019-03-12 |
| 公開(公告)號: | CN111292758B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 孟建華;董斐;張維城;戚萌;林福輝 | 申請(專利權)人: | 展訊通信(上海)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0216;G10L25/51;G10L25/78 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李笑笑;吳敏 |
| 地址: | 201203 上海市浦東新區浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 活動 檢測 方法 裝置 可讀 存儲 介質 | ||
1.一種語音活動檢測方法,其特征在于,包括:
獲取采集到的語音信號;
分別采用語音降噪算法和諧波檢測算法,判斷所述語音信號是否存在語音活動;
當所述語音降噪算法和所述諧波檢測算法均判定所述語音信號存在語音活動時,判定從所述語音信號中檢測到語音活動;
所述分別采用語音降噪算法和諧波檢測算法,判斷所述語音信號是否存在語音活動,包括:對所述語音信號進行快速傅里葉變換,得到語音信號頻域幅度譜;采用維納濾波降噪算法對所述語音信號進行語音降噪計算,得到降噪后的語音信號頻域幅度譜;根據維納濾波器函數、所述降噪后的語音信號頻域幅度譜以及所述語音信號頻域幅度譜,計算降噪前后語音信號頻域幅度譜的能量比值;所述維納濾波器函數根據所述維納濾波降噪算法和所述語音信號的噪聲估計值計算得到;所述噪聲估計值采用噪聲估計算法計算得到;當所述能量比值小于預設的第二能量比值閾值時,判定所述語音信號存在語音活動;
或,所述分別采用語音降噪算法和諧波檢測算法,判斷所述語音信號是否存在語音活動,包括:對所述語音信號進行快速傅里葉變換,得到語音信號頻域幅度譜;確定所述語音信號頻域幅度譜的峰值個數;所述語音信號頻域幅度譜的峰值采用如下方式確定:當所述語音信號頻域幅度譜中的第i個頻率點對應的頻域幅度譜大于第i+1個頻率點對應的頻域幅度譜、第i-1個頻率點對應的頻域幅度譜以及第i個頻率點對應的預設幅度閾值中的最大值時,確定所述第i個頻率點對應的頻域幅度譜為所述語音信號語音頻域幅度譜的一個峰值;當所述峰值個數超過預設峰值個數閾值時,判定所述語音信號存在語音活動。
2.如權利要求1所述的語音活動檢測方法,其特征在于,所述分別采用語音降噪算法和諧波檢測算法,判斷所述語音信號是否存在語音活動,包括:
對所述語音信號進行語音降噪計算,得到降噪后的語音信號;
計算所述語音信號對應的能量以及所述降噪后的語音信號對應的能量,得到降噪前后語音信號的能量比值;
當所述能量比值小于預設的第一能量比值閾值時,判定所述語音信號存在語音活動。
3.如權利要求1所述的語音活動檢測方法,其特征在于,采用如下公式計算所述降噪前后語音信號頻域幅度譜的能量比值:
其中,Ew為降噪前后語音信號頻域幅度譜的能量比值,ks為預設的頻率點起點,ke為預設的頻率點終點,Y(k)為所述語音信號頻域幅度譜,S'(k)為所述降噪后的語音信號頻域幅度譜。
4.如權利要求1所述的語音活動檢測方法,其特征在于,所述預設的第二能量比值閾值與以下值正相關:所述語音信號對應的能量與所述噪聲估計值對應的能量的比值。
5.如權利要求1所述的語音活動檢測方法,其特征在于,所述分別采用語音降噪算法和諧波檢測算法,判斷所述語音信號是否存在語音活動,包括:
當所述語音信號在預設的語音基頻范圍內且包含諧波特征時,判定所述語音信號存在語音活動。
6.如權利要求1所述的語音活動檢測方法,其特征在于,所述第i個頻率點對應的預設幅度閾值采用以下方式得到:
對所述語音信號進行快速傅里葉變換,得到語音信號頻域幅度譜;
選取所述語音信號的噪聲估計值、所述語音信號頻域幅度譜均值、所述第i-1頻率點至所述第i+1頻率點內對應的最小語音頻域幅度譜中的極大值,作為所述第i個頻率點對應的預設幅度閾值;所述語音信號的噪聲估計值采用噪聲估計算法計算得到。
7.如權利要求1所述的語音活動檢測方法,其特征在于,在確定所述語音信號頻域幅度譜的峰值個數之后,還包括:
將每個峰值對應的頻率索引值依次作為基頻頻率,計算基頻頻率對應的峰值之后的每個峰值對應的頻率索引值與所述基頻頻率的倍頻偏差;
當所述倍頻偏差大于預設偏差閾值時,排除所述峰值;
根據所述倍頻偏差和剩余的峰值,依次計算全部剩余峰值的加權值;
對每個基頻頻率下對應的加權值進行大小比較,選取最大加權值;
當最大加權值大于預設加權閾值時,判定所述語音信號存在語音活動。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于展訊通信(上海)有限公司,未經展訊通信(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910184966.8/1.html,轉載請聲明來源鉆瓜專利網。





