[發明專利]一種情感增強的細粒度情感預測方法、裝置、系統及存儲介質有效
| 申請號: | 202010168893.6 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111475615B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 徐睿峰;梁斌;毛瑞彬;張俊;楊敏;杜嘉晨;范創 | 申請(專利權)人: | 哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F18/214;G06Q50/00 |
| 代理公司: | 深圳市添源創鑫知識產權代理有限公司 44855 | 代理人: | 周椿 |
| 地址: | 518000 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 情感 增強 細粒度 預測 方法 裝置 系統 存儲 介質 | ||
本發明提供了一種情感增強的細粒度情感預測方法,包括執行以下步驟:步驟1:根據方面詞語或屬性的特性對數據進行擴建;步驟2:結合對抗訓練構造細粒度情感分析對抗網絡模型,并且通過共享特征提取器提取所有訓練樣本的共通情感特征;步驟3:將提取到的共通情感特征和特定方面的情感特征相結合來構造對抗訓練多任務學習網絡框架,協助模型對數據樣本缺乏文本進行細粒度情感識別。本發明的有益效果是:1.本發明所提出的對抗訓練多任務學習框架能通過特征提取器和判別器共同學習提取到的共享特征來協助細粒度情感分類模型對輸入文本進行細粒度情感預測;2.本發明基于這種對抗訓練和多任務學習方法,可以增強數據集不同方面的情感特征表示。
技術領域
本發明涉及互聯網技術領域,尤其涉及一種情感增強的細粒度情感預測方法、裝置、系統及存儲介質。
背景技術
隨著社交網絡平臺的迅速發展,傳統的簡單情感分析已無法有效獲取用戶評論中的情感信息表達。細粒度情感分析需要針對文本中特定的方面(Aspect)進行情感預測,這不僅需要考慮給定文本的信息同時也要考慮文本所對應的不同方面。如在用戶評論中,用戶會從不同方面出發來發表意見,對事物進行更深層次的情感表述。
然而,在現實的用戶評論中,用戶對不同方面的情感表達往往是有偏向性和針對性的。這種偏向性的情感表達會導致用戶評論在方面層面上的數據分布不平衡問題,即某些方面的情感表達數據量在用戶評論中會非常有限和缺乏。此外,由于情感表述的共通性,一些情感表達在修飾不同方面時的情感極性是一致的。例如句子“Decent?wine?atreasonable?prices”和“Decent?food?at?reasonable?prices”,對于方面“wine”和“food”的情感極性都是積極的。
近年來,隨著深度網絡模型在自然語言處理領域取得的突破,結合注意力機制(Attention?Mechanism)的深度網絡模型在細粒度情感分析任務中也取得了先進的效果。現有的基于深度網絡的細粒度情感分析模型主要是以文本和特定方面作為網絡的輸入,并通過抽象化表示的一系列運算來提取特定方面在情感特征。此外,結合注意力機制的深度網絡模型可以根據注意力信息的學習和更新能挖掘出文本中針對某一方面的情感特征表達,得到細粒度情感預測結果。但是這類方法只針對獨立的樣本進行情感特征提取和細粒度情感分析,它們的缺點在于:
1.在細粒度情感分析任務中,只對獨立樣本進行情感極性預測,忽視了不用方面之間的情感聯系;
2.由于方面級別的樣本分布不平衡和樣本缺失等問題,訓練集樣本無法有效覆蓋測試集樣本,以往的模型無法通過有限的訓練數據對測試樣例進行細粒度情感分析;
在對方面進行情感預測時,忽視了共通情感特征的提取和使用。
發明內容
本發明提供了一種情感增強的細粒度情感預測方法,包括執行以下步驟:
步驟1:根據方面詞語或屬性的特性對數據進行擴建;
步驟2:結合對抗訓練構造細粒度情感分析對抗網絡模型,并且通過共享特征提取器提取所有訓練樣本的共通情感特征;
步驟3:將提取到的共通情感特征和特定方面的情感特征相結合來構造對抗訓練多任務學習網絡框架,協助模型對數據樣本缺乏文本進行細粒度情感識別。
作為本發明的進一步改進,在所述步驟1中還包括執行以下步驟:第1步驟:統計每一個方面的訓練樣本數量,并且計算出平均數;
第2步驟:將類似的方面進行分組保存;
第3步驟:在每一組的方面樣本中,隨機從樣本數量大于平均數的方面樣本中抽取足量的樣本,并且將樣本涉及的方面替換成方面樣本少于平均數的方面,直到該方面的訓練樣本量達到平均數。
作為本發明的進一步改進,在所述步驟2中,還包括執行以下步驟:第一步驟:特征提取器F接收文本的詞向量矩陣作為模型的輸入,并提取特征信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院),未經哈爾濱工業大學(深圳)(哈爾濱工業大學深圳科技創新研究院)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010168893.6/2.html,轉載請聲明來源鉆瓜專利網。





