[發明專利]一種基于細粒度事件信息增強的短文本隱式情感分類方法在審
| 申請號: | 202310052123.9 | 申請日: | 2023-02-02 |
| 公開(公告)號: | CN116029293A | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 倪麗萍;劉玉強;陳星月;王琪 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F18/241;G06N3/0442;G06N3/08 |
| 代理公司: | 安徽省合肥新安專利代理有限責任公司 34101 | 代理人: | 陸麗莉;何梅生 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 細粒度 事件 信息 增強 文本 情感 分類 方法 | ||
1.一種基于細粒度事件信息增強的短文本隱式情感分類方法,其特征在于,是按如下步驟進行:
步驟1、獲取評論數據中的短文本并構建數據集,對所述數據集中的所有短文本進行數據預處理,得到每個短文本對應的分詞集合,其中,任意一個短文本的分詞集合s=(s1,s2,...,si,...,sa),其中,si表示分詞集合s中第i個詞,a表示分詞集合s中詞的總數;
步驟2、使用事件抽取器對分詞集合s進行單事件的抽取,以抽取出單事件的各個元素,從而得到相應短文本對應的細粒度單事件元組t=(t1,t2,...,tl,...,tb),其中,tl表示單事件元組t中第l個元素,b表示單事件元組t中元素的總數,l∈[1,b];
步驟3、將單事件元組t輸入BERT預訓練模型,得到單事件元組t中每個元素的隱藏狀態,其中,第l個元素的隱藏狀態記為Hl;
步驟4、將單事件元組t中每個元素的隱藏狀態輸入到注意力機制網絡中,用于得到單事件元組t的表征向量;
步驟4.1、利用式(1)和式(2)計算單事件元組t中第l個元素tl的注意力得分αl:
ul=sigmoid(W1Hl+b1)?????(1)
式(1)中,W1是第一權重矩陣,b1是第一偏置向量,sigmoid表示激活函數,ul是單事件元組t中第l個元素tl的新隱藏狀態;
式(2)中,T表示轉置操作,θl表示隨機初始化的第l個元素tl的注意力矩陣;
步驟4.2、利用式(3)得到單事件元組t的注意力特征向量ht,并作為單事件元組t的表征向量:
步驟5、將分詞集合s輸入所述BERT預訓練模型中,得到短文本的隱藏向量hs,從而利用式(4)得到單事件信息增強的短文本表征rfinal:
式(4)中,W2是第二權重矩陣,b2是第二偏置向量,T表示轉置操作,T[1:K]是一個由K個維度為d×d的矩陣組成的張量,f表示融合函數,htTT[1:K]hs表示一個K維張量積;
步驟6、將短文本表征rfinal輸入Bi-GRU模型的前向GRU模型中進行處理,并得到短文本表征rfinal的前向隱藏向量再將短文本表征rfinal逆序輸入Bi-GRU模型的后向GRU模型中進行處理,并得到短文本表征rfinal的后向隱藏向量
步驟7、利用式(5)得到短文本表征rfinal最終的隱藏向量h:
步驟8、將所述隱藏向量h輸入到sigmoid層中,從而利用式(6)得到相應短文本的正向情感或負向情感對應的概率值y,以選取較大概率值所對應的情感作為相應短文本最終的情感分類結果:
式(6)中,W3是第三權重矩陣,b3是第三偏置向量。
2.一種電子設備,包括存儲器以及處理器,其特征在于,所述存儲器用于存儲支持處理器執行權利要求1所述短文本隱式情感分類方法的程序,所述處理器被配置為用于執行所述存儲器中存儲的程序。
3.一種計算機可讀存儲介質,計算機可讀存儲介質上存儲有計算機程序,其特征在于,所述計算機程序被處理器運行時執行權利要求1所述短文本隱式情感分類方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310052123.9/1.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





