[發(fā)明專利]一種基于類邊界分布特性的音頻分類器訓練方法有效
| 申請?zhí)枺?/td> | 201310374246.0 | 申請日: | 2013-08-23 |
| 公開(公告)號: | CN103412945A | 公開(公告)日: | 2013-11-27 |
| 發(fā)明(設計)人: | 冷嚴;王孝朋;齊廣慧;徐新艷 | 申請(專利權)人: | 山東師范大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 邊界 分布 特性 音頻 分類 訓練 方法 | ||
技術領域
本發(fā)明涉及一種音頻分類器訓練方法,尤其涉及一種基于類邊界分布特性的音頻分類器訓練方法。
背景技術
音頻分類是指對音頻文檔中的不同音頻類型進行分類,比如,從音頻文檔中分類出語音部分、音樂部分等等。音頻分類具有廣泛應用,比如,西班牙的一項研究采用音頻分類技術對會議音頻文檔進行分類,以便于會議音頻的分類歸檔;美國約克大學的一項研究對記錄人們的日常行為的音頻文檔進行音頻分類,以便于描述人們的社會活動等等。音頻分類需要訓練良好的分類器以及良好的分類策略,目前多數(shù)的音頻分類研究多集中在分類策略的研究上。然而,我們認為訓練性能良好的分類器更加重要,因為如果訓練的分類器的分類性能好的話,則簡單的分類策略即可得到滿意的分類結果。訓練具有良好性能的分類器的一種有效手段就是采用主動學習的方法。主動學習是一個循環(huán)迭代的過程,在每一輪迭代中,主動學習挑選信息含量最大的那些樣本參與訓練,直到滿足停止準則。在主動學習技術中最關鍵的一步就是信息含量大的樣本的選擇。目前的研究中對信息含量大的樣本的選擇多是基于不確定性的,即將那些當前分類器不確定的樣本選作信息含量大的樣本,用其參與訓練。本發(fā)明通過考察音頻樣本的類邊界分布特性后認為,僅僅基于不確定性進行樣本選擇是不夠的,因此本發(fā)明總結了音頻樣本的類邊界分布特性,然后根據(jù)這些特性來選擇信息含量大的樣本參與訓練,進而得到分類性能良好的音頻分類器。
發(fā)明內容
本發(fā)明的目的就是為了解決上述問題,提供一種基于類邊界分布特性的音頻分類器訓練方法,它具有提高分類器性能,同時減少人工標注工作量的優(yōu)點。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
一種基于類邊界分布特性的音頻分類器訓練方法,具體步驟為:
步驟一:輸入初始已標注音頻樣本集L和未標注音頻樣本集U,建立音頻樣本數(shù)據(jù)庫,并利用初始已標注音頻樣本集L對SVM分類器進行第一次訓練;
步驟二:確定當前SVM分類器的稀疏區(qū)域,并將稀疏區(qū)域擴展至包含混淆區(qū)域,從擴展后的稀疏區(qū)域內選出分類信息量大的樣本,并消除信息量大的樣本中存在的冗余;
步驟三:將分類信息量大的樣本交由專家標注后放入已標注樣本集L中;
步驟四:用更新的已標注樣本集L再次訓練SVM分類器;
步驟五:判斷是否滿足停止準則,滿足則停止迭代,輸出訓練好的SVM分類器;不滿足則重復步驟二~步驟四。
所述步驟二的具體步驟為:
步驟(2-1):將當前分類器的分類間隔等分成M個互不交疊的區(qū)域,得到具有M個柱狀體的直方圖H,根據(jù)直方圖H中各個柱狀體的概率值求得待分類的兩類的熵和,將能使該熵和取最大值的柱狀體所代表的連續(xù)區(qū)域定義為當前SVM分類器分類間隔內的稀疏區(qū)域;
步驟(2-2):利用直方圖中各個柱狀體的混淆率對當前SVM分類器的稀疏區(qū)域進行擴展,使得擴展后的稀疏區(qū)域包含混淆區(qū)域;
步驟(2-3):將擴展后的稀疏區(qū)域內的樣本按照其決策值與擴展前稀疏區(qū)域內的樣本的平均決策值的差值絕對值大小進行升序排序,排序后根據(jù)樣本不共享最近鄰支持向量的原則以及樣本不能互為最近鄰的原則,消除信息含量大的樣本中存在的冗余;
所述步驟(2-1)的具體步驟為:
(21-1)用當前分類器對未標注樣本進行分類;
(21-2)將分類間隔等分成互不交疊的M個區(qū)域,對每個區(qū)域內的樣本數(shù)(包括已標注的樣本和未標注的樣本)進行統(tǒng)計,得到具有M個柱狀體的直方圖H,M為自然數(shù);
(21-3)令pi(i=1,…,M)表示直方圖H中第i個柱狀體的概率,該概率值等于第i個柱狀體中樣本數(shù)和樣本集中位于分類器分類間隔內的樣本數(shù)的比值,樣本集中位于分類器分類間隔內的樣本包括已標注的樣本和未標注的樣本;
(21-4)設Ω1,Ω2表示兩個類,假設兩類之間的分類閾值為t(t=1,…,M),則類Ω1的熵和類Ω2的熵表示成關于閾值t的函數(shù),即:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東師范大學,未經山東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310374246.0/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。





