[發(fā)明專利]一種基于特征融合與集成學(xué)習(xí)的語音情感分類方法有效
| 申請?zhí)枺?/td> | 202110209708.8 | 申請日: | 2021-02-25 |
| 公開(公告)號: | CN112861984B | 公開(公告)日: | 2022-07-01 |
| 發(fā)明(設(shè)計)人: | 郭奕;熊雪軍;徐亮;黃永茂;卿朝進(jìn);黃文韜 | 申請(專利權(quán))人: | 西華大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/20;G10L25/63 |
| 代理公司: | 北京正華智誠專利代理事務(wù)所(普通合伙) 11870 | 代理人: | 楊浩林 |
| 地址: | 610039 四川*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特征 融合 集成 學(xué)習(xí) 語音 情感 分類 方法 | ||
1.一種基于特征融合與集成學(xué)習(xí)的語音情感分類方法,其特征在于,包括以下步驟:
S1、采集若干語音數(shù)據(jù),并對語音數(shù)據(jù)進(jìn)行預(yù)處理;
S2、對預(yù)處理后的數(shù)據(jù)進(jìn)行特征提取,并構(gòu)建特征集;
S3、采用多分類器構(gòu)建集成學(xué)習(xí)分類模型,并對集成學(xué)習(xí)分類模型進(jìn)行訓(xùn)練;
S4、采用訓(xùn)練后的集成學(xué)習(xí)分類模型對待識別語音數(shù)據(jù)對應(yīng)特征集進(jìn)行識別,獲取分類結(jié)果,得到語音情感分類結(jié)果;
所述步驟S2具體為:
S2.1、對預(yù)處理后的數(shù)據(jù)進(jìn)行特征提取,得到若干特征;
S2.2、將若干特征組成若干維的特征向量;
S2.3、基于已訓(xùn)練的LightGBM模型,獲取特征向量中每個特征的重要性,并按重要性將特征進(jìn)行降序排序;
S2.3、獲取特征重要度平均值,并將重要性低于平均值的特征濾除;
S2.4、采用序列前向算法選擇最優(yōu)特征子集,完成特征集的構(gòu)建;
所述步驟S2.1中特征包括特征1至特征809;
所述特征1-8具體為:短時能量及其一階差分的均值、方差、最大值以及最小值;
特征9-14具體為:聲音強(qiáng)度及其一階差分的均值、方差以及最大值;
特征15具體為:平均語速;
特征16-23具體為:基音頻率及其一階差分的均值、方差、最大值以及最小值;
特征24-53具體為:第一、第二、第三共振峰頻率及其一階差分的均值、方差、最大值、最小值以及中值;
特征54-137具體為:1-12階梅爾倒譜系數(shù)MFCC的均值、方差、最大值、最小值、中值、極差以及和;
特征138-221具體為:1-12階伽馬倒譜系數(shù)GFCC的均值、方差、最大值、最小值、中值、極差以及和;
特征222-305具體為:1-12階巴克倒譜系數(shù)BFCC的均值、方差、最大值、最小值、中值、極差以及和;
特征306-389具體為:1-12階線性預(yù)測系數(shù)LPC的均值、方差、最大值、最小值、中值、極差以及和;
特征390-473具體為:1-12階線性預(yù)測倒譜系數(shù)LPCC的均值、方差、最大值、最小值、中值、極差以及和;
特征474-557具體為:1-12階標(biāo)準(zhǔn)化伽馬啁啾倒譜系數(shù)NGCC的均值、方差、最大值、最小值、中值、極差以及和;
特征558-641具體為:1-12階基于幅度的譜根倒譜系數(shù)MSRCC的均值、方差、最大值、最小值、中值、極差以及和;
特征642-725具體為:1-12階基于相位的譜根倒譜系數(shù)PSRCC的均值、方差、最大值、最小值、中值、極差以及和;
特征726-809具體為:1-12階線性頻率倒譜系數(shù)LFCC的均值、方差、最大值、最小值、中值、極差以及和。
2.根據(jù)權(quán)利要求1所述的基于特征融合與集成學(xué)習(xí)的語音情感分類方法,其特征在于,所述步驟S1中對語音數(shù)據(jù)進(jìn)行預(yù)處理具體包括預(yù)加重、消除趨勢項、端點處理、分幀處理以及加窗處理。
3.根據(jù)權(quán)利要求1所述的基于特征融合與集成學(xué)習(xí)的語音情感分類方法,其特征在于,所述步驟S3中集成學(xué)習(xí)分類模型中分類器包括支持向量機(jī)SVM、K鄰近算法、XGBoost算法和LightGBM算法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西華大學(xué),未經(jīng)西華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110209708.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





