[發明專利]細粒度情感分析方法、系統、電子設備和存儲介質有效
| 申請號: | 201911280917.0 | 申請日: | 2019-12-09 |
| 公開(公告)號: | CN111078881B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 鄧艷江;羅超;胡泓 | 申請(專利權)人: | 攜程計算機技術(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06N3/0464;G06N3/084;G06N3/0442;G06N3/045 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 細粒度 情感 分析 方法 系統 電子設備 存儲 介質 | ||
本發明公開了一種細粒度情感分析方法、系統、電子設備和存儲介質。方法包括:利用加入Attention機制的Bi?LSTM訓練多標簽的粒度分類模型,所述粒度分類模型用于對文本所涉及的粒度進行分類;利用門控神經網絡訓練多分類的情感分類模型,所述情感分類模型用于對所述文本所涉及的粒度的情感偏向進行分類;在對待分析文本進行細粒度情感分析時,先利用所述粒度分類模型分出所述待分析文本所涉及的粒度,然后利用所述情感分類模型分出所述待分析文本所涉及的粒度的情感偏向,再然后將分類結果匯總得到對所述待分析文本的細粒度情感分析結果。本發明采用層級分類的方案總共只需兩個模型,大大降低了訓練模型的工程量及預測耗時。
技術領域
本發明屬于文本處理領域,尤其涉及一種細粒度情感分析方法、系統、電子設備和存儲介質。
背景技術
隨著AI(人工智能)技術的發展,對用戶的細粒度情感偏向分析也快速進步,尤其是針對電商網站、社交網絡等互聯網應用,需要從用戶的評價、評論和用戶的主觀言論中分析出用戶的情感態度,從而挖掘更深的價值。
細粒度情感分析屬于多標簽文本分類任務,目前該任務場景下,主流技術多采用將多標簽分類拆分為多個二分類模型的方案來解決。每一個粒度分別訓練一個模型,上線使用時一個樣本須遍歷所有的分類模型,從而訓練模型的工程量較大,且預測耗時較長。
另外,細粒度情感分析中涉及的粒度較多,標注數據量也較大,若采用傳統的標注數據方式將所有的樣本所涉及的粒度和情感偏向逐一標注,標注代價太大。
發明內容
本發明要解決的技術問題是為了克服現有技術中采用多個二分類模型并為每一個粒度訓練一個模型的方式進行細粒度情感分析而導致訓練模型的工程量大且預測耗時長的缺陷,提供一種細粒度情感分析方法、系統、電子設備和存儲介質。
本發明是通過下述技術方案來解決上述技術問題:
一種細粒度情感分析方法,包括:
利用加入Attention(注意力)機制的Bi-LSTM(雙向長短期記憶網絡)訓練多標簽的粒度分類模型,所述粒度分類模型用于對文本所涉及的粒度進行分類,每個標簽分別表示一個粒度,每個粒度分別表示文本場景中的一個對象的一種屬性,所述Attention機制內包含可訓練的Label?Embedding(標簽嵌入)參數,所述Label?Embedding參數表示當前粒度,用以控制Attention篩選當前粒度相關的信息;
利用門控神經網絡訓練多分類的情感分類模型,所述情感分類模型用于對所述文本所涉及的粒度的情感偏向進行分類,每個分類分別表示一種情感偏向,所述情感分類模型包括Aspect?Embedding(方面嵌入)參數,所述Aspect?Embedding參數表示所述文本所涉及的粒度,由所述粒度分類模型的分類結果確定;
在對待分析文本進行細粒度情感分析時,先利用所述粒度分類模型分出所述待分析文本所涉及的粒度,然后利用所述情感分類模型分出所述待分析文本所涉及的粒度的情感偏向,再然后將所述粒度分類模型和所述情感分類模型的分類結果匯總得到對所述待分析文本的細粒度情感分析結果。
較佳地,在訓練所述粒度分類模型時,基于主動學習算法挑選樣本標注、訓練初始模型、增加樣本標注、擴充訓練集、訓練新模型,以及多次重復增加樣本標注、擴充訓練集和訓練新模型的步驟直至所述粒度分類模型收斂;
和/或,在訓練所述情感分類模型時,基于主動學習算法挑選樣本標注、訓練初始模型、增加樣本標注、擴充訓練集、訓練新模型,以及多次重復增加樣本標注、擴充訓練集和訓練新模型的步驟直至所述情感分類模型收斂。
較佳地,利用加入Attention機制的Bi-LSTM訓練多標簽的粒度分類模型的步驟具體包括:
收集文本樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程計算機技術(上海)有限公司,未經攜程計算機技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911280917.0/2.html,轉載請聲明來源鉆瓜專利網。





