[發(fā)明專利]細粒度情感分析方法、系統(tǒng)、電子設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201911280917.0 | 申請日: | 2019-12-09 |
| 公開(公告)號: | CN111078881B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 鄧艷江;羅超;胡泓 | 申請(專利權(quán))人: | 攜程計算機技術(shù)(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/289;G06F40/30;G06N3/0464;G06N3/084;G06N3/0442;G06N3/045 |
| 代理公司: | 上海弼興律師事務(wù)所 31283 | 代理人: | 薛琦;張冉 |
| 地址: | 200335 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 細粒度 情感 分析 方法 系統(tǒng) 電子設(shè)備 存儲 介質(zhì) | ||
1.一種細粒度情感分析方法,其特征在于,包括:
利用加入Attention機制的Bi-LSTM訓(xùn)練多標簽的粒度分類模型,所述粒度分類模型用于對文本所涉及的粒度進行分類,每個標簽分別表示一個粒度,每個粒度分別表示文本場景中的一個對象的一種屬性,所述Attention機制內(nèi)包含可訓(xùn)練的Label?Embedding參數(shù),所述Label?Embedding參數(shù)表示當(dāng)前粒度,用以控制Attention篩選當(dāng)前粒度相關(guān)的信息;
利用門控神經(jīng)網(wǎng)絡(luò)訓(xùn)練多分類的情感分類模型,所述情感分類模型用于對所述文本所涉及的粒度的情感偏向進行分類,每個分類分別表示一種情感偏向,所述情感分類模型包括Aspect?Embedding參數(shù),所述Aspect?Embedding參數(shù)表示所述文本所涉及的粒度,由所述粒度分類模型的分類結(jié)果確定;
在對待分析文本進行細粒度情感分析時,先利用所述粒度分類模型分出所述待分析文本所涉及的粒度,然后利用所述情感分類模型分出所述待分析文本所涉及的粒度的情感偏向,再然后將所述粒度分類模型和所述情感分類模型的分類結(jié)果匯總得到對所述待分析文本的細粒度情感分析結(jié)果。
2.如權(quán)利要求1所述的細粒度情感分析方法,其特征在于,在訓(xùn)練所述粒度分類模型時,基于主動學(xué)習(xí)算法挑選樣本標注、訓(xùn)練初始模型、增加樣本標注、擴充訓(xùn)練集、訓(xùn)練新模型,以及多次重復(fù)增加樣本標注、擴充訓(xùn)練集和訓(xùn)練新模型的步驟直至所述粒度分類模型收斂;
和/或,在訓(xùn)練所述情感分類模型時,基于主動學(xué)習(xí)算法挑選樣本標注、訓(xùn)練初始模型、增加樣本標注、擴充訓(xùn)練集、訓(xùn)練新模型,以及多次重復(fù)增加樣本標注、擴充訓(xùn)練集和訓(xùn)練新模型的步驟直至所述情感分類模型收斂。
3.如權(quán)利要求1所述的細粒度情感分析方法,其特征在于,利用加入Attention機制的Bi-LSTM訓(xùn)練多標簽的粒度分類模型的步驟具體包括:
收集文本樣本;
對所述文本樣本進行預(yù)處理,所述預(yù)處理包括繁簡轉(zhuǎn)換、大小寫轉(zhuǎn)換、去除特殊標點符號、分句中的至少一種以及分詞;
將分詞后所得的詞語利用詞向量庫映射為xi,利用Bi-LSTM提取語義特征,得i時刻的隱向量hi;
分別以各粒度的Label?Embedding參數(shù)為輸入,利用Attention機制計算各粒度的context向量,其中,ct代表第t個粒度的context向量,st代表第t個粒度的Label?Embedding參數(shù);
對各ct分別做全連接,輸出維度均為1,并利用sigmoid作為激活函數(shù),輸出yt,其中,yt代表第t個粒度被涉及的概率值:
利用binary?crossentropy損失函數(shù)計算損失,并利用反向傳播優(yōu)化模型。
4.如權(quán)利要求1所述的細粒度情感分析方法,其特征在于,利用門控神經(jīng)網(wǎng)絡(luò)訓(xùn)練多分類的情感分類模型的步驟具體包括:
收集文本樣本;
對所述文本樣本進行預(yù)處理,所述預(yù)處理包括繁簡轉(zhuǎn)換、大小寫轉(zhuǎn)換、去除特殊標點符號、分句中的至少一種以及分詞;
將分詞后所得的詞語利用詞向量庫映射為向量;
利用門控神經(jīng)網(wǎng)絡(luò)訓(xùn)練情感分類模型,模型內(nèi)不同粒度對應(yīng)的Aspect?Embedding參數(shù)的值不同。
5.如權(quán)利要求1所述的細粒度情感分析方法,其特征在于,若利用所述粒度分類模型分析出所述待分析文本沒有涉及的粒度,則結(jié)束分析;
若先利用所述粒度分類模型分析出所述待分析文本所涉及的粒度為多個,則利用所述情感分類模型分出所述待分析文本所涉及的每個粒度相對應(yīng)的情感偏向。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于攜程計算機技術(shù)(上海)有限公司,未經(jīng)攜程計算機技術(shù)(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911280917.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種管理和傳送細粒度業(yè)務(wù)的方法
- 基于CPU硬件性能監(jiān)控計數(shù)器的CPI精確測量方法
- 一種基于改進YOLOv3的細粒度圖像分類方法
- 細粒度對象流量分析方法和裝置
- 一種基于點云數(shù)據(jù)建模的方法、裝置和電子設(shè)備
- 細粒度圖像分類方法、系統(tǒng)、計算機設(shè)備及存儲介質(zhì)
- 基于圖像卷積特征的復(fù)雜背景下害蟲細粒度圖像識別方法
- 一種細粒度分類模型的優(yōu)化方法、系統(tǒng)及相關(guān)裝置
- 一種結(jié)合注意力混合裁剪的細粒度圖像識別方法
- 基于分級式結(jié)構(gòu)的細粒度視頻動作識別方法





