[發(fā)明專利]一種模型訓練層AdaBoost算法的參數(shù)優(yōu)化方法在審
| 申請?zhí)枺?/td> | 201710332545.6 | 申請日: | 2017-05-12 |
| 公開(公告)號: | CN107170443A | 公開(公告)日: | 2017-09-15 |
| 發(fā)明(設計)人: | 羅森林;潘麗敏;王懷慶;劉曉雙 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L25/51;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 adaboost 算法 參數(shù) 優(yōu)化 方法 | ||
技術領域
本發(fā)明涉及一種模型訓練層AdaBoost算法的參數(shù)優(yōu)化方法。從應用場景的角度講,屬于音頻事件識別技術領域;從技術實現(xiàn)的角度來講,亦屬于計算機科學與音頻處理技術領域。
背景技術
音頻事件識別技術是基于音頻數(shù)據(jù)的內(nèi)容,識別音頻流中的事件聲音段落。音頻事件識別技術在有廣泛的應用,可用于異常場景的監(jiān)控,如無人車行駛環(huán)境下的異常聲音事件,公共場所異常騷亂情況等。隨著數(shù)字多媒體技術的快速發(fā)展,以及多終端移動設備的普及應用,音頻數(shù)據(jù)的數(shù)量正以指數(shù)形式進行增長,音頻事件識別技術的應用價值越來越顯著。
近年來,研究者們針對不同的應用場景提出了多種多樣的音頻事件識別算法。音頻事件識別系統(tǒng)的模塊數(shù)量、識別流程程度都在變得復雜,各模塊的關鍵參數(shù)數(shù)量也不斷增加,傳統(tǒng)的網(wǎng)格法參數(shù)尋優(yōu)耗時多、需要人工介入、并且結果易陷入局部最優(yōu)解,甚至有多參的高分辨率優(yōu)化無法實施等問題。因此,迫切需要針對音頻事件識別系統(tǒng)的參數(shù)優(yōu)化問題進行研究,提出更快速、有效并且方便地實現(xiàn)識別系統(tǒng)參數(shù)的整體優(yōu)化。
目前關于音頻事件識別的參數(shù)優(yōu)化研究較少,尚處于起步階段,將不同的參數(shù)優(yōu)化算法引入音頻事件識別技術領域,對于減少參數(shù)優(yōu)化耗時、提高準確率、完善音頻事件識別的理論體系,為其他領域提供基礎技術,有較高的實用和理論價值。
發(fā)明內(nèi)容
本發(fā)明的目的是:針對音頻事件識別系統(tǒng)模型訓練層算法參數(shù)的優(yōu)化問題,提出了一種模型訓練層AdaBoost算法的參數(shù)優(yōu)化方法,緩解模型訓練階段網(wǎng)格法尋優(yōu)耗時嚴重的問題。
本發(fā)明的設計原理如圖1所示,具體為:首先,提取音頻訓練樣本底層特征,生成特征向量;然后,使用模擬退火算法進行AdaBoost模型的參數(shù)優(yōu)化;最后使用優(yōu)化后參數(shù)生成音頻事件識別模型。本發(fā)明可以提高系統(tǒng)的參數(shù)優(yōu)化速度,得到較好的識別結果。
本發(fā)明的技術方案是通過如下步驟實現(xiàn)的:
步驟1,采集并生成音頻事件訓練樣本,完成數(shù)據(jù)的預處理,具體實現(xiàn)方法為:
步驟1.1,采集多段音頻,將音頻中的某一特定事件標記為正樣本,音頻中其余事件標記為負樣本;
步驟1.2,提取音頻樣本特征向量;
步驟1.3,將N個音頻片段中的l個正樣本片段記為yi=1,m負樣本片段記為yi=0,l+m=N。
步驟2,使用AdaBoost算法訓練音頻事件識別模型,具體方法如下:
步驟2.1,初始化權重
步驟2.2,對第t次訓練(T為總訓練次數(shù),且t=1,2,…,T),歸一化權重:
步驟2.3,對每一維特征j,訓練弱分類器hj,計算其樣本集的分類錯誤率:
步驟2.4,選取分類率et最小的分類器ht,放入強分類器列表;
步驟2.5,更新樣本權重:
其中,i=1,2,…,N,如果樣本xi被正確分類,則ei=0,否則ei=1;
步驟2.6,重復步驟2.2至步驟2.5共T次。
步驟3,對AdaBoost參數(shù)進行優(yōu)化,具體方法如下:
步驟3.1,在步驟2中隨機設定一個迭代次數(shù)T0,將步驟2輸出結果的準確度記為f(T0)=A,使用T0和A作為模擬退火算法的初始值,步驟2中的數(shù)據(jù)操作函數(shù)f作為目標函數(shù);
步驟3.2,運行模擬退火算法;
步驟3.3,記錄模擬退火算法結果Tbest,并將此值作為AdaBoost的迭代次數(shù)。
有益效果
相比于常用的網(wǎng)格法進行參數(shù)優(yōu)化,本發(fā)明提出的基于模擬退火的音頻事件識別模型參數(shù)優(yōu)化方法,通過隨機搜索方式對參數(shù)尋優(yōu)路徑進行調(diào)整,緩解了模型訓練階段網(wǎng)格法尋優(yōu)耗時嚴重的問題。
本發(fā)明所提方法,對模型訓練層AdaBoost算法參數(shù)進行優(yōu)化,逼近迭代次數(shù)的最優(yōu)解。在保持優(yōu)秀的識別效果的同時,極大地縮短了參數(shù)優(yōu)化時間,進而提高模型訓練的效率。
附圖說明
圖1為本發(fā)明提出的訓練層AdaBoost算法的參數(shù)優(yōu)化方法原理圖;
具體實施方式
為了更好的說明本發(fā)明的目的和優(yōu)點,下面結合實例對本發(fā)明方法的實施方式做進一步詳細說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經(jīng)北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710332545.6/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





