[發明專利]一種基于長短時記憶網絡快速識別語音情感類別的方法在審
| 申請號: | 202110485958.4 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113053418A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 顏思瑞;丁凱星;謝躍;陳允韜;王超 | 申請(專利權)人: | 南京工程學院 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/30;G10L25/03 |
| 代理公司: | 南京創略知識產權代理事務所(普通合伙) 32358 | 代理人: | 呂娟 |
| 地址: | 211167 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 短時記憶 網絡 快速 識別 語音 情感 類別 方法 | ||
1.一種基于長短時記憶網絡快速識別語音情感類別的方法,其特征在于,包括以下步驟:
S1、從原始語音數據樣本中提取具有時序信息的幀級語音特征;
S2、通過軟注意力模型創建基于注意力機制的改進型LSTM模型;
S3、用已知的原始語音數據樣本及其語音情感類別對步驟S2中創建好的改進型LSTM模型進行訓練,訓練好后得到情感類別識別模型;
S4、對步驟S3得到的情感類別識別模型進行情感識別測試驗證;
S5、將未知的原始語音數據樣本輸入情感類別識別模型進行識別,輸出對應的語音情感類別。
2.根據權利要求1所述的一種基于長短時記憶網絡快速識別語音情感類別的方法,其特征在于,步驟S2中通過軟注意力模型創建基于注意力機制的改進型LSTM模型,包括以下步驟:
S21、用軟注意力模型中的注意力門替代常規型LSTM模型中的遺忘門以得到新遺忘門;
S22、以步驟S21得到的新遺忘門與常規型LSTM模型中輸入控制門的對偶關系,取代常規型LSTM模型中的輸入控制門,得到注意力機制的改進型LSTM模型。
3.根據權利要求2所述的一種基于長短時記憶網絡快速識別語音情感類別的方法,其特征在于,步驟S21中,用軟注意力模型中的注意力門替代常規型LSTM模型中的遺忘門以得到新遺忘門,包括如下步驟:
S21.1、對常規型LSTM模型進行分析,利用LSTM引入細胞結構,通過自循環方式,使得常規型LSTM模型能夠關聯RNN過去的歷史序列,其具體計算公式如下:
ft=σ(Wf·[ht-1,xt,Ct-1]+bf) (1)
it=σ(Wi·[ht-1,xt,Ct-1]+bi) (2)
ot=σ(Wo·[ht-1,xt,Ct]+bo) (5)
ht=ot*tanh(Ct) (6)
其中,σ為sigmoid激活函數,其取值范圍在[0,1]之間,代表了遺忘歷史細胞狀態的概率;tanh為雙曲正切激活函數;ht-1為t-1時刻的隱層輸出,ft、it、ot分別為遺忘門,輸入控制門和輸出門,Wf和bf分別是遺忘門的權重和偏置,Wi和bi分別是輸入控制門的權重和偏置,WC和bC分別是細胞狀態的權重和偏置,Wo和bo分別是輸出門的權重和偏置,它們是常規型LSTM模型的待訓練參數,xt為t時刻的輸入,Ct和Ct-1分別為t與t-1時刻的細胞狀態,為t時刻的細胞狀態候選值;
S21.2、通過注意力機制優化了常規型LSTM內部的遺忘門計算方式,ft與it取值在0到1之間,它們分別是歷史細胞狀態與候選細胞狀態的加權分數,如公式(4)所示;
步驟S22中,以步驟S21得到的新遺忘門與常規型LSTM模型中輸入控制門的對偶關系,取代常規型LSTM模型中的輸入控制門,得到注意力機制的改進型LSTM模型,包括以下步驟:
S22.1、通過注意力機制來計算歷史細胞狀態與候選細胞狀態的加權分數,替代常規型LSTM模型中的遺忘門與輸入控制門,得到新的細胞狀態,新的細胞狀態更新公式如下:
其中sh和sc分別是歷史細胞狀態和候選細胞狀態的加權系數,它們是依據歷史細胞狀態與當前候選細胞狀態進行計算的,與當前輸入和歷史輸出無關,其中Wh與Wc均是注意力公式里的待學習權重參數,exp是以e為底的指數函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京工程學院,未經南京工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110485958.4/1.html,轉載請聲明來源鉆瓜專利網。





