[發明專利]一種實時聲學事件檢測系統及檢測方法無效
| 申請號: | 201110280525.1 | 申請日: | 2011-09-21 |
| 公開(公告)號: | CN102509545A | 公開(公告)日: | 2012-06-20 |
| 發明(設計)人: | 韓紀慶;石自強 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06 |
| 代理公司: | 哈爾濱市松花江專利商標事務所 23109 | 代理人: | 張宏威 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 實時 聲學 事件 檢測 系統 方法 | ||
1.一種實時聲學事件檢測系統,其特征是:它包括目標聲學事件識別模型(1)、目標聲學事件識別模型訓練模塊(2)、音頻讀取與播放模塊(3)、音頻特征實時提取模塊(4)、目標聲學事件識別檢測模塊(5)和可視化模塊(6);
目標聲學事件識別模型訓練模塊(2)用于根據音頻特征實時提取模塊(4)提取出的特征,訓練目標聲學事件識別模型(1);
音頻讀取與播放模塊(3),用于實時提取音頻特征并送入音頻特征實時提取模塊(4);還用于將音頻信號送入可視化模塊(6);
音頻特征實時提取模塊(4)用于對音頻讀取與播放模塊(3)的音頻特征進行提取;
目標聲學事件識別檢測模塊(5)用于在對音頻特征實時提取模塊(4)提取的特征的基礎上進行目標聲學事件識別模型(1)實時事件檢測;并將實時檢測結果送入可視化模塊(6);
可視化模塊(6)用于顯示音頻讀取與播放模塊(3)的音頻的實時波形,還用于顯示目標聲學事件識別檢測模塊(5)的實時檢測結果。
2.根據權利要求1所述的一種實時聲學事件檢測系統,其特征在于音頻讀取與播放模塊(3)包括:音頻讀取模塊、音頻信息提取模塊和音頻播放模塊,
音頻讀取模塊用于讀取用戶指定音頻,記錄音頻原始信息,并存儲音頻信號,然后對音頻信號進行預處理后送入音頻特征實時提取模塊(4);
音頻信息提取模塊用于以幀為單位實時提取音頻特征,并對提取特征進行歸正,將送入音頻特征實時提取模塊(4);
音頻播放模塊用于對用戶指定音頻進行播放、暫停、停止或快進操作。
3.根據權利要求1所述的一種實時聲學事件檢測系統,其特征在于目標聲學事件識別模型訓練模塊(2)包括SVM模型訓練模塊和GMM模型訓練模塊,用于支持目標聲學事件識別模型建立過程中的多種模式分類方法。
4.根據權利要求1所述的一種實時聲學事件檢測系統,其特征在于目標聲學事件識別檢測模塊(5)包括單分類器識別模塊和分類結果融合模塊;
單分類器識別模塊用于通過目標聲學事件的模型對實時提取的音頻特征進行分類,得到初步結果;
分類結果融合模塊用于將所述初步結果進行分類及過融合獲得對音頻片段的實時檢測結果。
5.根據權利要求1所述的一種實時聲學事件檢測系統,其特征在于可視化模塊(6)包含音頻文件波形顯示模塊和檢測結果顯示模塊;
音頻波形顯示模塊用于實時可視化待檢測音頻數據;
檢測結果顯示模塊用于實時可視化檢測模塊得到的結果。
6.根據權利要求1所述的一種實時聲學事件檢測系統,其特征在于它還包括模型管理模塊(7),所述模型管理模塊(7)用于對訓練模塊中得到的模型進行管理操作,包括模型的加載、刪除和更新。
7.基于權利要求1的一種實時聲學事件檢測方法,其特征是:它由以下步驟實現:
步驟一、建立目標聲學事件識別模型(1),采用音頻特征實時提取模塊(4)對音頻讀取與播放模塊(3)的音頻特征進行提取,目標聲學事件識別模型訓練模塊(2)根據提取的特征對目標聲學事件識別模型(1)進行數據訓練;
步驟二、目標聲學事件識別檢測模塊(5)在對音頻特征實時提取模塊(4)提取的特征的基礎上進行目標聲學事件識別模型(1)實時事件檢測;并將實時檢測結果通過可視化模塊(6)顯示輸出。
8.基于權利要求1的一種實時聲學事件檢測方法,其特征在于步驟一中采用音頻特征實時提取模塊(4)對音頻讀取與播放模塊(3)的音頻特征進行提取,對提取到的音頻特征的處理方法包括如下步驟:
步驟A1、音頻信息提取模塊從待分析音頻頭文件中提取信息;
步驟A2、根據待處理音頻數據結構信息,采用不同的變換系數進行設置;
步驟A3、從待分析信號數據的排序緩沖區中,選擇能保存新到達數據的排序單元;
步驟A4、判斷是否能夠找到能保存新到達數據的緩沖區,如果判斷結果為是,則執行步驟A5;如果判斷結果為否,則申請新的緩沖區,并判斷是否成功申請到新的緩沖區,如果判斷結果為是,則執行步驟A5;如果判斷結果為否,則執行步驟A7;
步驟A5、將待分析信號數據保存到緩沖區;
步驟A6、從待分析信號中提取特征,存入特征數據單元;
步驟A7、結束音頻特征的處理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110280525.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種靜壓氣浮軸承
- 下一篇:一種克隆表達腈水合酶調控蛋白的方法





