[發明專利]基于MF?PLPCC特征的工程機械聲音識別方法在審
| 申請號: | 201710060595.3 | 申請日: | 2017-01-25 |
| 公開(公告)號: | CN106992011A | 公開(公告)日: | 2017-07-28 |
| 發明(設計)人: | 曹九穩;曹敏;王建中 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/21;G10L25/48;G10L19/04 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙)33240 | 代理人: | 杜軍 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 mf plpcc 特征 工程機械 聲音 識別 方法 | ||
1.基于MF-PLPCC特征對工程機械聲音識別方法,其特征在于包括以下步驟:
步驟1、采集工程機械作業時候的聲音和周圍環境噪聲,并將采集的聲音信號建立聲音樣本庫;
步驟2、對聲音樣本庫中所有的聲音信號進行預加重、分幀和加窗處理;
步驟3、求出經過步驟2處理后的每幀聲音信號的短時能量譜;
步驟4、基于短時能量譜求出通過Mel三角濾波器組的短時能量;
步驟5、用立方根對短時能量進行強度-響度轉換;
步驟6、對轉換后的信號采用傅里葉逆變換轉換到時域中;
步驟7、求出時域中信號的線性預測系數;
步驟8、基于線性預測系數計算倒譜系數,即所求的聲音特征;
步驟9、對不同機械的聲音特征進行標號,建立樣本特征庫;
步驟10、基于訓練樣本特征庫,利用正則化極限學習機建立模型;
步驟11、重復步驟1-步驟8,對目標聲音進行MF-PLPCC特征提取;
步驟12、利用正則化極限學習機對提取的目標聲音特征和步驟10建立的模型進行匹配,然后得出分類結果;
步驟13、根據分類結果,判斷目標聲音是哪種機械在作業或者是周圍噪。
2.根據權利要求1所述的基于MF-PLPCC特征對工程機械聲音識別方法,其特征在于所述的步驟2對采集的聲音信號作預加重,具體的:設聲音信號為x(n),采樣率為fs,預加重處理后的信號為x(n)=x(n)-k*x(n-1),其中k為預加重系數,k介于0.9~1之間;然后對預加重后的信號做分幀和加窗處理。
3.根據權利要求1所述的基于MF-PLPCC特征對工程機械聲音識別方法,其特征在于所述的步驟3求出每幀聲音信號的短時能量譜,具體如下:
將經過步驟2處理得到的聲音信號做短時傅里葉變換,然后根據頻譜求出短時能量譜,設第ii幀信號為si(n),對該幀信號作短時傅里葉變換得到Xi(k),通過計算得到短時能量譜為Pi(k)
Pi(k)=Re[Xi(k)]2+Im[Xi(k)]2。
4.根據權利要求1所述的基于MF-PLPCC特征對工程機械聲音識別方法,其特征在于所述的步驟4基于短時能量譜求出通過Mel三角濾波器組的短時能量,具體的:
將短時能量譜通過一組Mel尺度的三角濾波器組,得到Mel頻譜的短時能量Si(m);定義三角濾波器組的中心頻率為f(m),m=1,2,…M,其中M為濾波器的個數,各個中心頻率f(m)之間的間隔隨著m值的增大而增寬。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710060595.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:無直達聲條件下的麥克風陣列語音增強裝置
- 下一篇:語音處理方法及電子設備





