[發明專利]一種深度協同交互的情感原因聯合抽取方法在審
| 申請號: | 202111188307.5 | 申請日: | 2021-10-12 |
| 公開(公告)號: | CN113947074A | 公開(公告)日: | 2022-01-18 |
| 發明(設計)人: | 史樹敏;鄔成浩;黃河燕 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F40/247 | 分類號: | G06F40/247;G06F16/35;G06F16/9536;G06F40/289;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 北京正陽理工知識產權代理事務所(普通合伙) 11639 | 代理人: | 張利萍 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 協同 交互 情感 原因 聯合 抽取 方法 | ||
1.一種深度協同交互的情感原因聯合抽取方法,其特征在于,包括以下步驟:
步驟1:獲取情感原因語料庫,獲取需要進行抽取的文本文檔及其情感候選原因文本;
所述情感原因語料庫,指對于情感原因抽取任務提供的相應具體情感和候選原因及待抽取的文檔集合,其中,語料庫中文檔包含顯式情感文本及隱式情感文本;候選原因能夠在任意級別進行標注;
步驟2:對于輸入的需要進行情感原因抽取的文檔及其候選原因文本進行分詞處理,得到對應文檔的文本序列s1以及候選原因的文本序列s2;
其中,文本序列s表達式為:{s=w1,w2,...,wN},表示需要進行情感分析的句子,該句子中有N個單詞w1,w2,...,wN,其中,下標N為句子單詞序列長度,w代表單詞;
步驟3:采用預訓練的單詞特征向量,分別表示文本序列s1與s2中的每個單詞的向量化表示,得到單詞特征表示;其中,將每個單詞的語義表示、位置表示的加和作為單詞特征向量,從而得到文本序列中各個詞對應的特征向量;
所述單詞特征向量,是指將輸入文本序列向量化所使用的預訓練向量,包括語義向量和位置向量,其中,語義向量指當前單詞的語義特征信息,位置向量指當前單詞在文本序列的位置特征信息;
步驟4:使用雙向長短時記憶網絡LSTM,分別對步驟3得到的文本序列s1與s2中的單詞表示進行句子層面的文本編碼;
步驟5:通過注意力Attention機制決定步驟4中每個詞語在表示學習過程中的重要性,并分別計算得到文本序列s1的淺層情感表示E、s2的淺層原因表示C;
步驟6:將步驟5輸出的淺層情感表示E和淺層原因表示C作為深度協同交互網絡模型的輸入,并輸出得到深層情感表示和深層原因表示;
步驟7:將步驟6中得到的深層情感表示EM和深層原因表示CM,分別通過Softmax層聯合計算對應的情感概率向量yE和原因概率向量yC;
當得到情感概率向量和原因概率向量后,使用兩者交叉熵的和作為損失函數,使用梯度下降的方式對參數進行更新,最小化模型的聯合預測誤差。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111188307.5/1.html,轉載請聲明來源鉆瓜專利網。





