[發明專利]利用紋理特征與隨機森林的快速抗噪鳥鳴聲識別方法有效
| 申請號: | 201310473337.X | 申請日: | 2013-10-11 |
| 公開(公告)號: | CN103474072A | 公開(公告)日: | 2013-12-25 |
| 發明(設計)人: | 李應;魏靜明 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G10L17/26 | 分類號: | G10L17/26;G10L17/02 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 利用 紋理 特征 隨機 森林 快速 鳥鳴 識別 方法 | ||
技術領域
本發明涉及鳥鳴聲識別技術領域,特別是一種利用紋理特征與隨機森林的快速抗噪鳥鳴聲識別方法。
背景技術
生態環境下普遍存在的鳥鳴聲中包含著豐富的信息,鳥鳴聲識別在了解鳥類行為等特征的同時,還可以對相關環境做一定程度的分析。鳥鳴聲識別的一般方法是先從鳥鳴聲片段中提取特征,然后結合分類器模型進行識別和分類。
原始鳥鳴聲信號經過短時傅里葉變換(Short-Time?Fourier?Transform,STFT)可以得到其時頻譜圖,該時頻譜圖本質上是一副灰度圖像,因此可以通過圖像特征實現鳥鳴聲識別。目前,借助圖像特征,鳥鳴聲識別領域已取得了一些成果。文獻[1]提出一種基于時頻譜圖有監督的時頻分割方法,利用時頻單元方差等特征進行鳥鳴聲識別。文獻[2]提出一種基于時頻譜圖形狀特征的方法,利用角度徑向變換特征實現鳥鳴聲自動識別。
不同于以上特征,紋理特征是一種全局統計特征,在圖像識別中具有較大的優越性。因此,我們試圖利用時頻譜圖紋理特征進行鳥鳴聲識別。紋理特征提取方法中,基于統計的灰度共生矩陣(Gray?Level?Co-occurrence?Matrix,GLCM)因其原理簡單、并能較好反映紋理圖像而被廣泛采用[3-6]。但GLCM的二維表示占用存儲空間大,提取二次統計紋理特征的過程計算量大、耗時多。在GLCM的改進算法中,和差統計法(Sum?and?Difference?Histograms,SDH)[7]的一維表示能夠有效地克服GLCM的缺點。
同時,為了進行鳥鳴聲識別,諸多單分類器模型被采用并取得良好的識別性能,如支持向量機(Support?Vector?Machine,SVM)[8]、隱馬爾科夫模型(Hidden?Markov?Model,HMM)[9]等。不過它們依然存在一些缺點,如對不同類型數據檢測性能不平衡、響應時間較長等。而隨機森林(Random?Forest,RF)[10]作為一種組合分類器,能有效解決單分類器面臨的問題。
此外,真實環境中普遍存在著各種背景噪聲,這使得噪聲環境下的鳥鳴聲識別具有重要的現實意義。文獻[11]采用譜減法,功率譜分析及自相關分析進行噪聲環境下的鳥鳴聲識別。文獻[12]利用基于幀線性預測編碼(Linear?Predictive?Coding,LPC)的聚類,提取有效音節實現噪聲環境下鳥鳴聲識別。但這些方法主要針對特定噪聲環境下的鳥鳴聲識別,不能普遍適用于真實環境中的非平穩噪聲。而短時譜估計[13]能夠有效處理非平穩噪聲下的音頻增強。
發明內容
本發明的目的是提供一種利用紋理特征與隨機森林的快速抗噪鳥鳴聲識別方法,解決了紋理特征提取過程中灰度共生矩陣(GLCM)占用空間大、耗時,以及識別和分類過程中常見單分類器分類速度慢的問題。
本發明采用以下方案實現:一種利用紋理特征與隨機森林的快速抗噪鳥鳴聲識別方法,其特征在于:步驟1,通過短時譜估計算法對鳥鳴聲帶噪功率譜進行音頻增強;步驟2,采用和差統計法(SDH)對增強功率譜快速提取紋理特征;步驟3,由隨機森林(RF)實現快速分類。
本發明首先通過短時譜估計對鳥鳴聲做增強處理,然后由SDH對得到的增強功率譜快速提取紋理特征,再結合RF進行快速識別和分類。實驗結果表明,該方法提取的紋理特征具有良好的識別性能,在紋理特征提取與識別和分類兩個環節都減少了時耗,同時能夠有效提高非平穩噪聲環境下鳥鳴聲識別性能。
附圖說明
圖1是本發明利用紋理特征與RF的快速抗噪鳥鳴聲識別方法流程示意圖。
圖2是本發明RF的基本原理框圖。
圖3a是繡眼波形圖。
圖3b是禿鷹波形圖。
圖3c是繡眼聲譜圖。
圖3d是禿鷹聲譜圖。
圖3e是增強后繡眼聲譜圖。
圖3f是增強后禿鷹聲譜圖。
圖4是實驗甲在不同噪聲環境和不同信噪比下的平均識別率。
圖5是實驗乙在不同噪聲環境和不同信噪比下的平均識別率。
具體實施方式
下面結合附圖及實施例對本發明做進一步說明。
本發明的利用紋理特征與RF的快速抗噪鳥鳴聲識別方法可分為前端處理、紋理特征提取以及識別和分類三個環節,如圖1所示。從真實環境中采集的原始鳥鳴聲信號y(t)可表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310473337.X/2.html,轉載請聲明來源鉆瓜專利網。





