[發明專利]一種基于深度學習的對話文本情感分析方法在審
| 申請號: | 202211084620.9 | 申請日: | 2022-09-06 |
| 公開(公告)號: | CN116306678A | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 尚文利;殷可晴;張夢;李俊;曹忠;韋蘊珊;李淑琦 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | G06F40/35 | 分類號: | G06F40/35;G06N3/0442;G06N3/045;G06N3/048 |
| 代理公司: | 廣州高炬知識產權代理有限公司 44376 | 代理人: | 孫明科 |
| 地址: | 510006 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 對話 文本 情感 分析 方法 | ||
本發明公開了一種基于深度學習的對話文本情感分析方法,包括以下步驟:S1、對數據集進行標簽歸類劃分;S2、對劃分好的數據集進行歸一化處理;S3、利用層次GRU模型對文本進行特征提取;S4、初始化GRU模型的訓練參數;S5、訓練GRU模型;S6、輸入預測語句,得出訓練結果。本發明提出一個基于層次GRU模型,底層為一個雙向GRU模型對單句特征進行提取,上層雙向GRU對上下文信息進行建模,獲取句子間的交互特征;在雙向GRU的隱藏層加入注意力機制,其輸出與單個單詞或者話語嵌入融合,強化每個詞或話語在上下文嵌入中的信息。本發明使用預訓練模型來獲取單句文本特征,能較好的解決數據庫規模較小的問題。
技術領域
本發明涉及文本分析領域,具體涉及一種基于深度學習的對話文本情感分析方法。
背景技術
情緒分析是一種從語言中提取和分析文字感情的工作,其最直接的目的是對其情緒趨勢和預測做出判斷。隨著互聯網的日益普及,人們在網上發表意見的方式也日益增多,因此,基于文本的情緒分析方法的研究顯得尤為重要。當前,人們對文本情感的研究主要集中在淘寶評價、網站評論等用戶評論上,而對于互動對話中的文字信息挖掘卻很少。從數據量、用戶層次、社會影響力等角度來看,交互文本具有不可忽略的價值,因此,基于對話文本進行情感分析具有重要的現實意義和潛在價值。
傳統的情感分析重點分析文本中帶有的評價態度,一般都是二分類,積極或消極,支持或反對,通常使用的文本分類方法,如支持向量機、卷積神經網絡等,都可以應用于基于對話的文本中進行情緒分類。而傳統文本分類方法不能根據上下文對情感,進而情感檢測效果較差。
因此,如何設計出一種能夠根據上下文來分析文本情感的方法是本領域技術人員亟需解決的問題。
發明內容
本發明提供一種基于深度學習的對話文本情感分析方法,提出一個基于層次GRU模型,底層為一個雙向GRU模型對單句特征進行提取,上層雙向GRU對上下文信息進行建模,獲取句子間的交互特征;在雙向GRU的隱藏層加入注意力機制,其輸出與單個單詞或者話語嵌入融合,強化每個詞或話語在上下文嵌入中的信息,以解決上述問題。
本發明提供如下的技術方案:
一種基于深度學習的對話文本情感分析方法,是基于層次GRU情感分析算法,其具體操作步驟如下:
S1、對數據集進行標簽歸類劃分;
S2、對劃分好的數據集進行歸一化處理;
S3、利用GRU模型對文本進行特征提取;
S4、初始化GRU模型的訓練參數;
S5、訓練GRU模型;
S6、輸入預測語句,得出訓練結果。
優選的,所述S1中,標簽包括憤怒、快樂、悲傷和中立。
優選的,所述訓練集、驗證集和測試集均包括輸入數據與輸出數據。
優選的,所述S2中,歸一化處理過程包括將單詞的大寫轉換成小寫,特殊詞性還原為原形,并且去除非字母數字的符號,保留問號和感嘆號;采用pad機制,補齊對話的長度,使對話長度保持一致。
優選的,所述S3中,特征提取過程包括單個話語信息提取、引入注意力機制和上下文信息提取。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211084620.9/2.html,轉載請聲明來源鉆瓜專利網。





