[發明專利]基于可變時長的音頻特征分類方法有效
| 申請號: | 201110033410.2 | 申請日: | 2011-01-30 |
| 公開(公告)號: | CN102623007A | 公開(公告)日: | 2012-08-01 |
| 發明(設計)人: | 盧敏;竇維蓓 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司 11246 | 代理人: | 童曉琳 |
| 地址: | 100084 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 可變 音頻 特征 分類 方法 | ||
1.一種基于可變時長的音頻特征分類方法,其特征是所述方法包括下列步驟:
步驟1:將確定類型并經過標注的音頻序列作為訓練序列;
步驟2:提取訓練序列中的音頻信號的短時特征F1,F2,...,FK,構成短時特征向量,K是短時特征向量的分量個數;
步驟3:計算各個短時特征Fk在設定時長內,當前幀和之前的(n-1)幀的短時特征的統計參量,n為設定時長內的總幀數;每個短時特征Fk對應一組由該短時特征的統計參量構成的統計特征向量,進而短時特征向量對應一個統計特征向量,其中;1≤k≤K;
步驟4:選取P個值,N1,N2,...,NP滿足N1<N2<...<NP,令n分別等于N1,N2,...,NP,按照步驟3計算得到短時特征向量對應的一組統計特征向量,由該組統計特征向量構成訓練序列的長時特征向量;
步驟5:利用訓練序列的長時特征向量訓練分類器;
步驟6:提取測試序列中的音頻信號的短時特征,并按照步驟2和步驟3的方法計算測試序列的第i幀的統計特征向量以及測試序列的
步驟7:根據測試序列的第i幀的統計特征向量以及測試序列的,計算測試序列的第i幀的輸入長時特征向量;
步驟8:將第i幀的輸入長時特征向量送入步驟5訓練后的分類器中,其輸出即為第i幀的分類類型。
2.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述短時特征包括對數能量、過零率和均勻子帶能量分布。
3.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述當前幀和之前的(n-1)幀的短時特征的統計參量包括當前幀和之前的(n-1)幀的短時特征最大值MaxFk(n)、最小值MinFk(n)、算術平均AvgFk(n)或方差VarFk(n)中的一個或多個。
4.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述利用訓練序列的長時特征向量訓練分類器具體是利用訓練序列的長時特征向量訓練單個分類器。
5.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述利用訓練序列的長時特征向量訓練分類器具體是使用前向特征選擇法,在訓練序列的長時特征向量中選擇有效特征構成有效長時特征向量,并利用有效長時特征向量訓練單個分類器。
6.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述利用訓練序列的長時特征向量訓練分類器具體是利用訓練序列的長時特征向量的分向量各自分別訓練同類型的單個分類器后并聯構成的分類器組。
7.根據權利要求4-6中任意一項權利要求所述的一種基于可變時長的音頻特征分類方法,其特征是所述單個分類器為基于正態分布的獨立特征分類器。
8.根據權利要求1所述的一種基于可變時長的音頻特征分類方法,其特征是所述計算測試序列的第i幀的輸入長時特征向量具體利用公式
其中,q=1,2,L,P-1,中的共有q個,中的共有P-q個。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110033410.2/1.html,轉載請聲明來源鉆瓜專利網。





