[發明專利]基于多任務聯合學習的文本情緒原因識別系統有效
| 申請號: | 202011138387.9 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112183064B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 廖祥文;李澤南;陳志豪;張艷茹;葉鍇 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/284;G06F40/30;G06F40/126;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 陳明鑫;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 任務 聯合 學習 文本 情緒 原因 識別 系統 | ||
本發明涉及一種基于多任務聯合學習的文本情緒原因識別系統。包括:數據預處理模塊,用于對數據進行預處理;文本編碼模塊,提取文本內容上下文依賴關系,獲取其隱層向量表示,作為文本子句信息的整體表示;相對位置信息嵌入模塊,從相對位置表示中學習出相對位置信息,并將其嵌入到文本子句向量中。情緒分類子任務模塊,通過引入情緒分類子任務,使模型學習到的相對位置信息表示能幫助情緒識別任務精準的定位目標子句的位置;情緒原因識別標簽輸出模塊,用于分析文本子句之間的上下文關系,完成情緒原因識別的標簽預測工作。本發明能夠從文本數據中學習高質量的文本向量特點,最終標注出關鍵情緒詞的原因。
技術領域
本發明涉及情感分析和情緒挖掘領域,更具體地,涉及一種基于多任務聯合學習的文本情緒原因識別系統,,能夠較好地提取文本的語音信息,能有效利用文本子句的相對位置信息,能夠精確的識別標注出文本中的情緒原因。
背景技術
個體情緒原因分析是自然語言處理領域非常重要的研究方向之一,它主要研究個體文本數據所蘊含的情緒及與情緒相關的深層信息,近年來由于其廣泛的應用潛力而受到關注,研究者們主要利用自然語言處理技術對個體文本數據進行分析,挖掘其中所包含的情緒的過程,是輿情分析監控及商品質量反饋等應用的核心部分。然而,僅對個體情緒進行分析是不夠充分的,知其然也需要知其所以然,產生情緒及情緒發生變化的原因比情緒本身有時候更值得引起我們重視。比如,決策者可能更關心反對者反對的原因,而不僅僅是反對者的數量。
Chen和Lee等人首次提出個體情緒原因提取任務,他們從中科院研究所中平衡語料庫中手動構建了一個關于個體情緒原因提取的小型語料庫,并且基于該語料庫開發了一種基于規則的方法來檢測情緒原因。Gao等人提出一種基于規則的情緒原因識別模型,然后對相應的微博數據進行情緒原因的抽取,然而,制定的規則并不能完全覆蓋所有的語言現象,而且同一個子句可能同時匹配多個規則,很容易造成規則沖突。再者不同領域語料的語言結構有一定的區別,針對特定領域的文本制定的規則并不能很好地適用于其他領域的文本,需要耗費巨大的人力物力重新分析語言結構來添加新的規則。Alena Neviarouskaya通過句法、語法和規則相結合的方法,分析情緒原因的語言現象,以此來推測一段文本的情緒類別和情緒原因。Weiyuan Li等人通過抽取情緒原因特征進行情緒分類,其特征抽取仍采用基于規則的方法。
在基于統計方法的情緒原因識別方面,袁麗提取語言學線索詞的特征、句子距離特征、候選詞詞法特征等信息,然后得到特征向量空間,最后應用SVM分類器和條件隨機場對個體情緒歸因進行了判別。Lin Gui等人不僅通過建立25條規則來進行個體情緒原因的預測,還運用分類方法來預測個體情緒原因。李逸薇等將個體情緒歸因識別任務看成序列標注,并建立了相應的模型,將所有候選原因子句當成一個序列,從而標記出哪些屬于原因子句,她特別指出在利用序列標注模型進行情緒原因識別的過程中,上下文特征尤為重要。Ghazi D等人利用FrameNet建立了情緒和情緒原因相關聯的數據集,然后利用CRF來預測文本句子級別的情緒。Gaoyan Ou等人建立文本公眾情緒和情緒事件之間關系,利用文本情緒對文本中事件進行預測。Lin Gui等人首先構建了一個情緒歸因語料庫,標注了表達情緒的核心子句,在核心句的前后子句中標注情緒原因子句,然后從核心句的前后每個子句中抽取候選原因事件,通過訓練分類器,最后判定抽取的候選原因事件是否是情緒核心子句的原因事件。
深度學習技術也已應用于情緒原因識別。Cheng等使用長短期記憶網絡來進行情緒原因檢測,提出了一種新的記憶網絡架構來對每個詞的上下文進行建模。但是在之前的研究中,大都數都僅僅只是使用了個體情緒的文本內容信息。
發明內容
本發明的目的在于提供一種基于多任務聯合學習的文本情緒原因識別系統,能夠抽取出有效特征,并對特征進行抽象和組合,最終識別出引起情緒變化的文本子句。
為實現上述目的,本發明的技術方案是:一種基于多任務聯合學習的文本情緒原因識別系統,包括:
數據預處理模塊,用于對文本數據進行預處理;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011138387.9/2.html,轉載請聲明來源鉆瓜專利網。





