[發明專利]一種聯合優化深層變換特征與聚類過程的聲場景聚類方法有效
| 申請號: | 201910033838.3 | 申請日: | 2019-01-15 |
| 公開(公告)號: | CN109859771B | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 李艷雄;劉名樂;王武城;張聿晗 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L25/24 | 分類號: | G10L25/24;G10L25/30;G10L25/45;G10L25/51 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聯合 優化 深層 變換 特征 過程 聲場 景聚類 方法 | ||
本發明公開了一種聯合優化深層變換特征與聚類過程的聲場景聚類方法,步驟如下:a、提取各樣本的對數梅爾譜特征并作為一個初始類,初始化一個卷積神經網絡;b、將各樣本的對數梅爾譜特征輸入卷積神經網絡,提取深層變換特征;c、采用凝聚分層聚類算法合并最相似的兩個類,得到新的類標簽及樣本并用于更新卷積神經網絡,類數減一,再采用更新后的卷積神經網絡將各樣本的對數梅爾譜特征變換為深層變換特征;d、如果當前類數等于真實類數,則停止聚類,得到聯合優化的聲場景聚類結果和卷積神經網絡,否則跳到第c步。本方法的深層變換特征提取與聚類交替進行,得到聯合優化結果,與傳統聚類方法相比性能更優;與傳統分類方法相比更具普適性。
技術領域
本發明涉及音頻信號處理與模式識別技術領域,特別涉及一種聯合優 化深層變換特征與聚類過程的聲場景聚類方法。
背景技術
聲場景聚類(Acoustic scene clustering,ASC)是對采集到的各類聲場景 音頻樣本進行相似度比較,將相同類別的音頻樣本合并在一起。聲場景聚 類的目的主要是讓機器更加智能化,使其擁有類似于人類分辨周圍聲學環 境的能力,從而能夠為人類提供更智能化的服務。聲場景聚類技術是音頻 監控、自動輔助駕駛、多媒體內容分析與檢索等應用領域的重要基礎,具 有重要的研究價值與實際意義。
傳統的監督聲場景分類方法需要對每個音頻訓練樣本進行人工標注 以便訓練分類器,但人工標注成本昂貴、主觀性強、效率低。目前各類聲 場景的音頻數據爆炸式增長,很多樣本都沒有標簽,因此有監督的聲場景 聚類方法在實際應用時有一定的局限性。目前無監督的聲場景分類方法一 般將音頻特征提取與聲場景聚類分開進行,不能得到最優的聲場景聚類結 果。因此,如何聯合優化特征提取與聲場景聚類過程以便得到較優的聚類結果,是進一步提高聲場景聚類性能的關鍵,也是海量音頻數據被充分挖 掘利用的重要手段之一。目前亟待提出一種聯合優化深層變換特征與聚類 過程的聲場景聚類方法,有效克服了目前方法的不足。
發明內容
本發明的目的是為了解決現有技術中的上述缺陷,提供一種聯合優化 深層變換特征與聚類過程的聲場景聚類方法。
本發明的目的可以通過采取如下技術方案達到:
一種聯合優化深層變換特征與聚類過程的聲場景聚類方法,所述的聲 場景聚類方法包括如下步驟:
S1、提取對數梅爾譜特征:對各類聲場景的樣本進行預加重、分幀、 加窗,然后分別提取每一音頻幀的對數梅爾譜特征;
S2、初始化各類及卷積神經網絡:將每個樣本作為一個初始類,初始 化生成一個卷積神經網絡用于提取深層變換特征;
S3、更新卷積神經網絡,提取新的深層變換特征:根據類標簽及各類 樣本更新卷積神經網絡參數,并用更新后的卷積神經網絡提取各類樣本的 深層變換特征;
S4、合并最相似的兩個類:采用凝聚分層聚類算法將相似度最大的兩 個類合并在一起,得到新的類標簽和各類樣本,類數減一;
S5、聚類收斂判決:如果當前類數等于真實類數,則停止聚類,得到 聯合優化的聲場景聚類結果和卷積神經網絡,否則跳到步驟S3。
進一步地,所述的步驟S1中提取對數梅爾譜特征具體包括以下步驟:
S1.1、音頻數據采集與標注:在不同的場景采集音頻數據流,然后將 每一個音頻數據流分割成一定長度的音頻段,三人或三人以上對音頻段進 行人工標注,對于存在異議的音頻段標注,按照少數服從多數的原則確定 最終的標簽;
S1.2、預加重:設置數字濾波器的傳遞函數為H(z)=1-αz-1,其中α為 一個系數且取值為:0.9≤α≤1,讀入的音頻段通過該數字濾波器后實現預 加重;
S1.3、分幀、加窗:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910033838.3/2.html,轉載請聲明來源鉆瓜專利網。





