[發(fā)明專利]語音情緒識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011536031.0 | 申請日: | 2020-12-23 |
| 公開(公告)號: | CN112489690A | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 曲道奎;杜威;王海鵬;鄒風(fēng)山;王曉東;高多 | 申請(專利權(quán))人: | 沈陽新松機(jī)器人自動(dòng)化股份有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/03;G10L25/30;G06N3/04;G06N3/08 |
| 代理公司: | 沈陽科苑專利商標(biāo)代理有限公司 21002 | 代理人: | 許宗富 |
| 地址: | 110168 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 情緒 識別 方法 系統(tǒng) | ||
1.一種語音情緒識別方法,其特征在于,該方法包括如下步驟:
a.將說話人的語音保存為原始語音文件,并對所述原始語音文件進(jìn)行音頻預(yù)處理,得到預(yù)處理后的語音文件;
b.使用音頻處理庫函數(shù),對所述預(yù)處理后的語音文件進(jìn)行音頻特征抽取,得到音頻特征向量或者譜圖像特征;
c.將抽取的音頻特征送入訓(xùn)練好的語音情緒識別模型,由語音情緒識別模型完成語音情緒識別。
2.如權(quán)利要求1所述的方法,其特征在于,所述的音頻預(yù)處理包括:靜音移除及數(shù)據(jù)增強(qiáng)。
3.如權(quán)利要求2所述的方法,其特征在于,所述的靜音移除包括:
使用語音能量作為閾值,如果所述原始語音文件一段時(shí)間內(nèi)的能量小于所設(shè)定的閾值時(shí),認(rèn)為當(dāng)前該段時(shí)間內(nèi)的音頻為噪音,并丟棄;然后保存丟棄所述噪音后的語音文件作為當(dāng)前語音文件。
4.如權(quán)利要求3所述的方法,其特征在于,所述的語音數(shù)據(jù)增強(qiáng)包括:
如果當(dāng)前語音文件短于最小音頻片段數(shù)據(jù),則將當(dāng)前語音文件中間開始截取一定長度,將該長度復(fù)制到原始語音文件的中間位置,以保證預(yù)處理后的語音文件滿足最短音頻時(shí)長要求。
5.如權(quán)利要求1所述的方法,其特征在于,所述的步驟b包括:
使用音頻處理庫函數(shù)抽取包括以音高、能量、過零率、色度為代表的韻律特征,以共振頻率、譜特征為代表的質(zhì)量特征,及以梅爾倒頻譜系數(shù)、MFCC一階導(dǎo)數(shù)、線性預(yù)測編碼系數(shù)為代表的導(dǎo)出特征,通過拼接的方式組成音頻特征向量。
6.如權(quán)利要求1所述的方法,其特征在于,所述的步驟b包括:
使用譜圖像特征的形式展示預(yù)處理后的語音文件的多維度特征。
7.如權(quán)利要求1所述的方法,其特征在于,所述語音情緒識別模型為卷積神經(jīng)網(wǎng)絡(luò)模型,采用所述卷積神經(jīng)網(wǎng)絡(luò)模型完成語音情緒識別。
8.如權(quán)利要求1所述的方法,其特征在于,所述語音情緒識別模型為融合雙向長短時(shí)記憶與注意力機(jī)制模型,采用所述融合雙向長短時(shí)記憶與注意力機(jī)制模型完成語音情緒識別。
9.一種語音情緒識別系統(tǒng),其特征在于,該系統(tǒng)包括預(yù)處理模塊、音頻特征抽取模塊以及語音情緒識別模塊,其中:
所述預(yù)處理模塊用于將說話人的語音保存為原始語音文件,并對所述原始語音文件進(jìn)行音頻預(yù)處理,得到預(yù)處理后的語音文件;
所述音頻特征抽取模塊用于使用音頻處理庫函數(shù),對所述預(yù)處理后的語音文件進(jìn)行音頻特征抽取,得到音頻特征向量或者譜圖像特征;
所述語音情緒識別模塊用于將抽取的音頻特征送入訓(xùn)練好的語音情緒識別模型,由語音情緒識別模型完成語音情緒識別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于沈陽新松機(jī)器人自動(dòng)化股份有限公司,未經(jīng)沈陽新松機(jī)器人自動(dòng)化股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011536031.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





