[發(fā)明專利]面向情感語音識別的情感維度PAD預測方法有效
| 申請?zhí)枺?/td> | 201810868027.0 | 申請日: | 2018-08-01 |
| 公開(公告)號: | CN109036466B | 公開(公告)日: | 2022-11-29 |
| 發(fā)明(設(shè)計)人: | 孫穎;張雪英;胡艷香;王少玄;李鳳蓮 | 申請(專利權(quán))人: | 太原理工大學 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L15/02;G10L15/06 |
| 代理公司: | 太原晉科知識產(chǎn)權(quán)代理事務所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
| 地址: | 030024 *** | 國省代碼: | 山西;14 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 面向 情感 語音 識別 維度 pad 預測 方法 | ||
本發(fā)明涉及一種情感維度預測技術(shù)領(lǐng)域,具體是一種面向情感語音識別的情感維度PAD預測方法。解決了現(xiàn)有情感特征僅從信號處理的角度識別情感,而忽略情感連續(xù)性的問題,包括以下步驟,采集數(shù)據(jù),對情感語音數(shù)據(jù)庫進行PAD維度值的標注,確定樣本訓練集與測試集;特征選擇,對情感語音數(shù)據(jù)庫提取情感特征;通過對訓練集的情感特征與人工標注PAD進行GRA關(guān)聯(lián)度分析選擇關(guān)聯(lián)性大的主要情感特征;對主要情感特征進行PCA降維,得到最優(yōu)特征;PAD維度預測,利用LSSVM回歸模型,基于選擇后的情感特征實現(xiàn)對情感維度P、A、D的預測;PAD維度情感識別,采用從心理學角度描述情感的、客觀預測的連續(xù)情感維度PAD進行語音情感識別。本發(fā)明具有預測效果好、識別精度高優(yōu)點。
技術(shù)領(lǐng)域
本發(fā)明涉及一種情感維度預測技術(shù)領(lǐng)域,具體是一種面向情感語音識別的情感維度PAD預測方法。
背景技術(shù)
語言是人類溝通最直接的方式,語言不僅可以傳遞文字信息,而且還包含情感信息,情感語音識別技術(shù)是情感識別的最有利工具,提取與情感關(guān)聯(lián)的特征是情感語音識別技術(shù)的關(guān)鍵之一。
關(guān)于情感特征的研究不斷發(fā)展,包含基于語言學的語音情感特征(包含詞匯、句法等)和基于超語言學的語音情感特征(韻律學特征、音質(zhì)特征、基于譜的相關(guān)特征、非線性特征、融合特征等),這些特征均在情感識別的領(lǐng)域得到了較廣泛的應用,但以上特征是從信號處理的角度對情感進行分析研究,而情感的產(chǎn)生涉及到人的心理活動,采用從心理學角度描述的量進行情感識別更加可靠、準確。連續(xù)情感維度從心理學的角度將情感映射在維度空間,某種情感被定為于維度空間的一點,近年來,對情感維度特別是較成熟的PAD情感維度的研究得到了越來越廣泛的關(guān)注。但目前關(guān)于PAD情感維度的研究主要是根據(jù)情感量表人工標注得到的PAD值,該方法受標注過程耗時長、主觀性大等影響,限制了情感維度領(lǐng)域的研究發(fā)展,所以必須對情感維度P、A、D進行客觀預測。
發(fā)明內(nèi)容
本發(fā)明為了解決現(xiàn)有情感特征僅從信號處理的角度識別情感,而忽略情感連續(xù)性的問題,提供一種面向情感語音識別的情感維度PAD預測方法。
本發(fā)明采取以下技術(shù)方案:一種面向情感語音識別的情感維度PAD預測方法,包括以下步驟,
S100~采集數(shù)據(jù),對情感語音數(shù)據(jù)庫進行PAD維度值的標注,確定樣本訓練集與測試集;
S200~特征選擇,對情感語音數(shù)據(jù)庫提取情感特征;通過對訓練集的情感特征與人工標注PAD進行GRA關(guān)聯(lián)度分析選擇關(guān)聯(lián)性大的主要情感特征;對主要情感特征進行PCA降維,得到最優(yōu)特征;
S300~PAD維度預測,利用LSSVM回歸模型,基于選擇后的情感特征實現(xiàn)對情感維度P、A、D的預測;
S400~PAD維度情感識別,采用從心理學角度描述情感的、客觀預測的連續(xù)情感維度PAD進行語音情感識別。
所述的S100包括以下步驟,
S101~對情感語音數(shù)據(jù)庫進行PAD維度值的標注,并根據(jù)數(shù)據(jù)特性規(guī)律,依據(jù)情感維度PAD數(shù)據(jù)是否服從正態(tài)分布對標注值進行有效性驗證;
S102~確定樣本訓練集與測試集,將情感語音數(shù)據(jù)樣本的2/3作為訓練樣本,情感語音數(shù)據(jù)樣本的1/3作為測試樣本。
所述的S200包括以下步驟,
S201~對情感語音數(shù)據(jù)庫提取情感特征;從兩個方面選擇特征,針對語音信號的短時平穩(wěn)特性提取聲學特征,即MFCC特征和韻律特征,以及針對語音的混沌特性提取非線性特征,將它們?nèi)诤虾螅玫?21維的特征集。
S202~通過對訓練集的情感特征與人工標注PAD進行GRA關(guān)聯(lián)度分析選擇關(guān)聯(lián)性大的主要情感特征;計算步驟如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于太原理工大學,未經(jīng)太原理工大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810868027.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





