[發明專利]一種對話文本的深度學習情感識別方法在審
| 申請號: | 202110371956.2 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN112967737A | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 黃志春;張定國;伍宇文;李韌;康文靜 | 申請(專利權)人: | 廣州偉宏智能科技有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/30;G10L25/03;G06N3/04;G06N3/08 |
| 代理公司: | 佛山市神機營專利代理事務所(普通合伙) 44765 | 代理人: | 許尤慶 |
| 地址: | 510000 廣東省廣州市天河區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 對話 文本 深度 學習 情感 識別 方法 | ||
本發明公開了一種對話文本的深度學習情感識別方法,包括包括以下步驟,S1、獲得文本對話集,對所述文本對話集的語音進行交疊分幀,并以幀為單位提取語音的幀特征;S2、對語音的幀特征進行時序建模,確定情感語音幀和非情感語音幀;S3、對情感語音幀進行注意力機制計算,使用Attent i on機制網絡模型計算每一幀對情感識別的重要性,并根據重要性決定使用每一個幀情感信息的多少;S4、將情感語音提取幀特征之后使用LSTM網絡進行編碼獲得情感語義編碼序列,并使用Attent i on機制計算出一個語義向量將其輸入到解碼器中進行解碼,并經過若干次時間步之后,解碼器輸出情感識別結果。
技術領域
本發明涉及情感計算、深度學習技術領域,具體為一種對話文本的深度學習情感識別方法。
背景技術
情感是人們在日常生活中表現出來的一種心理現象,對于智能機器,如果能夠實現快速準確地判斷人的情感狀態,就可以進一步理解用戶的情感。
情感識別是自然語言處理的一個重要任務,也是人工智能領域的重要領域,在工業界也有著廣泛的應用,如商品評論情感識別、基于文本的智能客服情感識別、以及討論主題的用戶情感識別等。因此,如何提高情感別的準確性有著重要意義。目前,常見的情感識別方法在情感識別過程常常存在無法正確識別用戶的真正的情感和識別精準度不高的缺陷。因此我們對此做出改進,提出一種對話文本的深度學習情感識別方法。
發明內容
為了解決上述技術問題,本發明提供了如下的技術方案:
本發明一種對話文本的深度學習情感識別方法,包括以下步驟:
S1、獲得文本對話集,對所述文本對話集的語音進行交疊分幀,并以幀為單位提取語音的幀特征;
S2、對語音的幀特征進行時序建模,確定情感語音幀和非情感語音幀;
S3、對情感語音幀進行注意力機制計算,使用Attention機制網絡模型計算每一幀對情感識別的重要性,并根據重要性決定使用每一個幀情感信息的多少;
S4、將情感語音提取幀特征之后使用LSTM網絡進行編碼獲得情感語義編碼序列,并使用Attention機制計算出一個語義向量將其輸入到解碼器中進行解碼,并經過若干次時間步之后,解碼器輸出情感識別結果。
作為本發明的一種優選技術方案,所述S2中時序建模包括構建情感語音所對應的情感狀態鏈,由情緒狀態和非情緒狀態;將整個情感語音樣本的標簽y在假設的指導下擴展為一個標簽序列yseg=(Null,y,Null,...,y,Null);根據yseg中y的個數確定一個文情感語音樣本對應的標簽序列斂。
作為本發明的一種優選技術方案,所述S2中時序建模采用LSTM-CTC時序深度學習模型,進行建模,并通過時間上誤差反向傳播算法訓練LSTM-CTC網絡,使其收斂。
作為本發明的一種優選技術方案,所述Attention機制的語音情感識別模型由兩個LSTM網絡模型組成,并分別作為編碼器和解碼器。
作為本發明的一種優選技術方案,所述Attention機制的語音情感識別模型識別流程為:對一個語音樣本的情感特征,進行編碼器,得到該語音的情感語義編碼序列,在得到語音的情感語義編碼序列后,將最后一個編碼向量輸入到解碼器之中開始進行情感解碼。
作為本發明的一種優選技術方案,所述解碼器接收兩個輸入,一個輸入是根據上一時刻注意力計算得到的情感語義向量,另外一個輸入是解碼器根據上一時刻的情感識別結果對應的情感表示向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州偉宏智能科技有限公司,未經廣州偉宏智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110371956.2/2.html,轉載請聲明來源鉆瓜專利網。





