[發明專利]一種用于實時監控的音頻聚類方法有效
| 申請號: | 201811484229.1 | 申請日: | 2018-12-06 |
| 公開(公告)號: | CN109783683B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 賀前華;吳志敏 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06F16/65 | 分類號: | G06F16/65;G06K9/62 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 何淑珍;黃海波 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 實時 監控 音頻 方法 | ||
本發明公開了一種用于實時監控的音頻聚類方法,包括步驟:(1)音頻數據預處理分段:利用基頻值特點把基頻值不同的時間上相鄰的兩個音頻段分離開;(2)基于特征點對齊的分段快速計算音頻距離:對計算的音頻樣本的N階特征點進行基于相似性度量的對齊后分段計算樣本距離,快速得到兩段音頻的距離;(3)利用連通距離提高聚類的類內純凈度:對于每段音頻,通過連通距離設定距離閾值來剔除噪點以提高類內純凈度,完成聚類。本發明通過切割細分增加了音頻樣本的事件獨立性,通過快速對齊進行分段DTW計算降低時間復雜度同時增加對齊精確度,在聚類過程中控制每一類的類內純凈度,以便后續模型建立中提高訓練樣本的純凈度,提高模型的描述能力。
技術領域
本發明涉及音頻聚類技術,特別涉及一種用于實時監控的音頻聚類方法。
背景技術
近年來,音頻監控作為視頻監控的補充形式,成為智能安防的熱點問題。在視頻監控的基礎上,加上音頻監控的輔助,可以輕松解決傳統視頻監控的難點。然而對于音頻監控來講,不同聲場景的音頻事件是不一致的,具有場景差異性。因此音頻事件分類器的訓練數據,必須來自當時的聲場景。所以,在這之前,對收集到的亂序的無標簽數據進行聚類,成為首要解決的問題。
由于聚類算法作為一種最常見的無監督學習技術,可以幫助人們給數據自動打標簽,在工程應用中得到比較成熟的應用。然而目前常用的聚類算法,諸如基于層次的方法可解釋性好,但是時間復雜度高,基于劃分的方法簡單高效,但需預先設定類別數,不能解決非凸數據等。由于數據通常可以以不同的角度進行歸類,因此每一種聚類算法都有其局限性和偏見性。而14年在science發表的基于密度峰值的聚類方法思想新穎,無需指定類別數且無需迭代,因此成為主要技術基礎。
在對數據集進行聚類之前,我們發現,傳統的端點檢測算法在靜音段與有事件的音頻段的檢測已經成熟,但是對于時間上連續的兩個獨立的音頻段的檢測尚未有有效方法,因此嘗試加入基頻特征信息,用以區分時間上相鄰的基頻值不同的兩個音頻段。同時,由于音頻信號具有相當大的隨機性,具體表現為相同的音頻事件由于發聲速度不一致導致的具有不同的時間長度,轉換成特征層面就是特征長度不一致的問題。因此首先要解決的問題是如何衡量特征長度不一時的相似性度量問題。動態時間規整(Dynamic TimeWarping,DTW)作為一個成熟的算法,可以解決這個問題。然而在具體實現中,當兩個待匹配的音頻段長度較長時,DTW在計算上存在計算量大的問題;同時,DTW本質上只有對同一對象的不同樣本實行匹配才有物理意義。因此在聚類過程中,把DTW作為相似性度量存在兩個問題,即嚴重拖延聚類速度,同時對不同對象樣本的匹配過程不具有物理意義。
發明內容
本發明為了解決上述技術問題提供一種用于實時監控的音頻聚類方法。
本發明的具體技術方案實現如下:
一種用于實時監控的音頻聚類方法,包括以下步驟:
(1)音頻數據預處理分段:利用基頻值特點把基頻值不同的時間上相鄰的兩個音頻段分離開;
(2)基于特征點對齊的分段快速計算音頻距離:對計算的音頻樣本的N階特征點進行基于相似性度量的對齊后分段計算樣本距離,快速得到兩段音頻的距離;
(3)利用連通距離提高聚類的類內純凈度:對于每段音頻,通過連通距離設定距離閾值來剔除噪點以提高類內純凈度,完成聚類。
作為優選的技術方案,為了使每個事件的音頻段得到更加精細的劃分,所述步驟(1)中,判定一個音頻段是否包含兩個獨立音頻段的步驟具體包括:
首先計算該段音頻信號中當前(i,i+N)幀的基頻值和(i-N,i)幀基頻值的差值Dvalue:
其中,PFk是第k幀的基頻,是(i,i+N)幀的基頻值之和,是(i-N,i)幀的基頻值之和;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811484229.1/2.html,轉載請聲明來源鉆瓜專利網。





