[發明專利]爆音檢測方法和裝置有效
| 申請號: | 201310195080.6 | 申請日: | 2013-05-23 |
| 公開(公告)號: | CN104143341A | 公開(公告)日: | 2014-11-12 |
| 發明(設計)人: | 吳小平 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/51 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 楊春香;宋志強 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 方法 裝置 | ||
1.一種爆音檢測方法,其特征在于,該方法包括:
將待檢測的一段語音信號劃分為多個語音幀;
對每一語音幀進行快速傅里葉變換處理,計算該語音幀在完成快速傅里葉變換處理后全頻段內每一頻點下的頻域能量值;
利用每一語音幀在全頻段內每一頻點下的頻域能量值計算該語音幀的全頻段平均能量值;
計算每一語音幀的低頻段平均能量值,并對所有語音幀的低頻段平均能量值進行聚類分析,根據聚類結果確定強能量數值范圍;
檢測每一語音幀的全頻段平均能量值是否在所述強能量數值范圍,當檢測出至少一個語音幀的全頻段平均能量值在所述強能量數值范圍時,確定待檢測的一段語音信號為爆音,當檢測出所有語音幀的全頻段平均能量值均不在所述強能量數值范圍時,確定待檢測的一段語音信號不為爆音。
2.根據權利要求1所述的方法,其特征在于,將待檢測的一段語音信號劃分為多個語音幀包括:
采用加窗方式將待檢測的一段語音信號劃分為多個語音幀,其中,在劃分語音幀時按照從待檢測的一段語音信號中每移動一個設定平移長度劃分一個語音幀,且劃分的語音幀的長度為設定加窗寬度。
3.根據權利要求1所述的方法,其特征在于,所述計算該語音幀在完成快速傅里葉變換處理后全頻段內每一頻點下的頻域能量值包括:
計算該語音幀在完成快速傅里葉變換處理后全頻段內每一頻點下幅度的對數值;
將該語音幀在每一頻點下幅度的對數值作為每一頻點下的頻域能量值。
4.根據權利要求1所述的方法,其特征在于,所述利用每一語音幀在全頻段內每一頻點下的頻域能量值計算該語音幀的全頻段平均能量值包括:
將每一語音幀在全頻段內每一頻點下的頻域能量值相加,得到第一計算結果;
將所述第一計算結果除以所述全頻段內所有頻點的數量,得到的結果作為該語音幀的全頻段平均能量值。
5.根據權利要求1所述的方法,其特征在于,所述計算每一語音幀的低頻段平均能量值包括:
從每一語音幀在全頻段內每一頻點下的頻域能量值中獲取屬于設定低頻段的每一頻點下的頻域能量值;
將獲取的每一頻點下的頻域能量值相加,并除以所述設定低頻段內所有頻點的數量,得到的結果作為該語音幀的低頻段平均能量值。
6.根據權利要求1所述的方法,其特征在于,對所有語音幀的低頻段平均能量值進行聚類分析包括:
步驟1,隨機從所有語音幀的低頻段平均能量值中選取兩個低頻段平均能量值分別作為當前聚類中心;
步驟2,針對每一個低頻段平均能量值,計算該低頻段平均能量值到每一當前聚類中心的距離,將該低頻段平均能量值歸為距離其最短的當前聚類中心對應的類;
步驟3,針對兩個當前聚類中心對應的類,分別計算該類中所有低頻段平均能量值的平均值,比較該計算的兩個平均值是否與兩個當前聚類中心相同,如果是,結束當前流程,將兩個當前聚類中心對應的類作為聚類結果,如果否,將計算的兩個平均值作為當前聚類中心,返回步驟2。
7.根據權利要求6所述的方法,其特征在于,所述根據聚類結果確定強能量數值范圍包括:
從作為聚類結果的兩個類中選擇出包含的低頻段平均能量值較大的類,將該選擇出的類中的所有低頻段平均能量值或者部分低頻段平均能量值作為強能量數值范圍。
8.一種爆音檢測裝置,其特征在于,該裝置包括:
劃分單元,用于將待檢測的一段語音信號劃分為多個語音幀;
處理單元,用于對每一語音幀進行快速傅里葉變換處理,計算該語音幀在完成快速傅里葉變換處理后全頻段內每一頻點下的頻域能量值;
計算單元,用于利用每一語音幀在全頻段內每一頻點下的頻域能量值計算該語音幀的全頻段平均能量值,并計算每一語音幀的低頻段平均能量值E1;
聚類單元,用于對所有語音幀的低頻段平均能量值進行聚類分析,根據聚類結果確定強能量數值范圍;
檢測單元,用于檢測每一語音幀的全頻段平均能量值是否在所述強能量數值范圍,當檢測出至少一個語音幀的全頻段平均能量值在所述強能量數值范圍時,確定待檢測的一段語音信號為爆音,當檢測出所有語音幀的全頻段平均能量值均不在所述強能量數值范圍時,確定待檢測的一段語音信號不為爆音。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310195080.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有下降邊表面的數據讀取器及用于其的方法
- 下一篇:音樂信號處理設備和方法





