[發明專利]一種細粒度情感分析方法有效
| 申請號: | 202110945239.6 | 申請日: | 2021-08-17 |
| 公開(公告)號: | CN113688634B | 公開(公告)日: | 2022-02-11 |
| 發明(設計)人: | 閆琰;周法國;張瀟;李旭峰;葛逸凡;李嘉裕 | 申請(專利權)人: | 中國礦業大學(北京) |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 100083 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 細粒度 情感 分析 方法 | ||
1.一種用于細粒度情感分析的方法,其特征在于,所述方法包括以下步驟:
步驟1:為數據集中每條樣本生成序列標簽和位置嵌入向量、標識樣本的首尾并補齊樣本長度,之后將樣本轉化為整數編碼序列,輸入bert模型生成樣本的嵌入向量;
步驟2:搭建實體數量預測模型、實體起始位置標注模型和實體長度預測模型,并將步驟1中的樣本的嵌入向量分別輸入三個模型進行訓練,完成評價對象提取任務;
步驟3:搭建情感預測模型,并將步驟1中的樣本的嵌入向量輸入情感預測模型進行訓練,完成情感極性分析任務;
步驟4:順次連接訓練后的實體數量預測模型、實體起始位置標注模型、實體長度預測模型以及情感預測模型,輸入待預測文本,抽取評價對象并分析評價對象的情感極性,
其中,步驟2中,實體數量預測模型的搭建步驟具體包括:
搭建輸入層,輸入向量化的文本序列;
搭建可訓練的位置嵌入模型,與向量輸入連接相加;
搭建批量歸一化模型,使得加上可訓練的位置嵌入模型的樣本近似服從N(0,1)分布;
搭建雙向門控循環單元網絡提取樣本特征,增強詞語間的前后聯系;
搭建注意力池化模型,對樣本特征進行降維壓縮;
使用focal loss作為損失函數、Nadam作為優化器,將步驟1中的樣本的嵌入向量輸入實體數量預測模型進行訓練;
其中,步驟2中,實體起始位置標注模型的搭建步驟具體包括:
搭建輸入層,輸入向量化的文本序列;
搭建可訓練的可訓練的位置嵌入模型,與向量輸入連接相加;
搭建批量歸一化模型,使得加上可訓練的位置嵌入模型的樣本近似服從N(0,1)分布;
搭建集成學習層,將雙向門控循環單元網絡、動態圖卷積神經網絡、有序長短時記憶模型和多頭注意力機制模型融合;
將步驟1中的樣本的嵌入向量輸入實體起始位置標注模型進行訓練,
其中,集成學習層的搭建步驟具體包括:
搭建雙向門控循環單元網絡,增強樣本詞語間的前后聯系,通過奇異值矩陣分解算法將其輸出分解,僅取其奇異值矩陣V;
搭建動態圖卷積神經網絡,將序列中的前后語句構建聯系;
搭建有序長短時記憶模型,提取語句的層次結構;
搭建多頭注意力機制模型,提取詞語間的相互影響關系;
將未經過任何處理的雙向門控循環單元網絡的輸出直接輸入進動態圖卷積神經網絡、有序長短時記憶模型以及多頭注意力機制模型,得到以上各個模型的輸出,再將所得輸出與經過Dense層處理的奇異值矩陣V進行點積,處理得到經過動態圖卷積神經網絡,有序長短時記憶模型以及多頭注意力機制模型的中間輸出;
將處理后的中間輸出相加得到最終輸出;
其中,步驟2中,實體長度預測模型的搭建步驟具體包括:
搭建輸入層,輸入向量化的文本序列;
搭建可訓練的可訓練的位置嵌入模型,與向量輸入連接相加;
搭建批量歸一化模型,使得加上可訓練的位置嵌入模型的樣本近似服從N(0,1)分布;
搭建雙向門控循環單元網絡提取樣本特征,增強詞語間的前后聯系;
搭建CRF算法通過實體的起始位置作為約束,預測實體的長度;
其中,步驟3中,情感預測模型的搭建步驟具體包括:
搭建輸入層,輸入向量化的文本序列和向量化的實體序列;
搭建注意力池化層與Dense層處理實體序列,統一其長度;
搭建條件層歸一化,將文本序列作為輸入,處理后的實體序列作為約束,得到情感傾向隱藏態;
搭建兩層雙向門控循環單元網絡,輸入情感傾向隱藏態進一步提取隱藏特征;
搭建膠囊網絡,分析雙向門控循環單元傳遞的隱藏特征得到不同情感分類的概率。
2.根據權利要求1所述的方法,其特征在于,搭建動態圖卷積神經網絡時,膨脹系數取句長除以8。
3.根據權利要求1所述的方法,其特征在于,搭建有序長短時記憶模型時,層次數量取4。
4.一種用于細粒度情感分析的系統,所述系統包括:處理器和用于存儲可執行指令的存儲器;其中,所述處理器被配置為執行所述可執行指令,以執行如權利要求1至3中任一項所述的細粒度情感分析的方法。
5.一種計算機可讀存儲介質,其特征在于,其上存儲有計算機程序,所述計算機程序被處理器執行時實現如權利要求1至3中任一項所述的用于細粒度情感分析的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學(北京),未經中國礦業大學(北京)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110945239.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于追蹤高空落物的視頻監控系統
- 下一篇:密閉型套管





