[發明專利]一種基于商品評價的方面級情感分析方法及系統在審
| 申請號: | 202310618152.7 | 申請日: | 2023-05-29 |
| 公開(公告)號: | CN116663566A | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 崔鵬;潘云輝 | 申請(專利權)人: | 貴州財經大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/211;G06F40/289;G06F16/35;G06N3/0464;G06N3/0442;G06N3/047;G06Q30/0282 |
| 代理公司: | 成都坤倫厚樸專利代理事務所(普通合伙) 51247 | 代理人: | 馬紅彥 |
| 地址: | 550025*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 商品 評價 方面 情感 分析 方法 系統 | ||
1.一種基于商品評價的方面級情感分析方法,其特征在于,采用以下步驟:
S1:數據預處理和準備:獲取商品評價文本數據,利用StanfordcoreNLP解析句子的句法依賴信息,進而獲得關于商品評價文本的依賴關系矩陣Arel、依賴類型序列兩種句法依賴信息;
S2:特征輸入:使用Bert預訓練模型或者Glove模型對商品評價文本的上下文語義信息進行詞向量映射;隨機初始化依賴類型的詞向量并進行詞嵌入操作,然后使用BiLSTM分別提取語義信息和句法依賴信息,得到語義信息的隱藏向量表示Hc和句法依賴信息的隱藏向量表示Hc1;將Hc與位置距離信息使用交互注意力機制進行融合,然后拼接融合后的Hc和Hc1,得到輸入的隱藏向量表示H;
S3:語義特征提取和句法依賴特征提取:使用多頭注意力機制分別求出關于語義信息隱藏向量的注意力得分矩陣Asem和關于句法依賴類型信息隱藏向量的注意力得分矩陣Atype,之后把Atype和Arel進行融合得到包含更豐富信息的依賴信息矩陣Asyn,然后Asem與S2階段得到的H送入語義信息圖卷積層進行語義信息的特征提取,Asyn與S2階段得到的H送入到句法信息圖卷積層進行句法信息特征提取;
S4:信息交互:使用交互注意力進行S3階段中每層上下文語義信息隱藏向量和句法依賴信息之間的信息隱藏向量交互,使得語義信息指導句法依賴信息參數更新學習,句法依賴信息指導語義信息參數更新學習,如此經過三層圖卷積操作,其中每層圖卷積之后進行交互注意力操作;
S5:情感極性分類:對經過特征提取和交互的最終隱藏輸出進行方面詞的MASK平均操作,然后softmax對商品評價文本進行最后的情感預測。
2.根據權利要求1所述的基于商品評價的方面級情感分析方法,其特征在于,在步驟S1中,在使用句法依賴類型的詞嵌入之前,首先構建關于依賴類型的語料庫,即依賴類型的詞匯表;在根據依存句法分析和句法解析構建依賴關系矩陣Arel時,使用StanfordNLP句法解析器。
3.根據權利要求1所述的基于商品評價的方面級情感分析方法,其特征在于,在步驟S2中,隨機初始化依賴類型詞向量中,將隨機初始維度設置成40維;用來提取語義信息的BiLSTM的隱藏層維度和提取句法依賴信息的BiLSTM的隱藏層維度設置成50維;使用一層BiLSTM提取隱藏特征,并在上述過程中使用dropout來防止模型過擬合,其中詞嵌入的dropout值設置為0.7,BiLSTM模型輸入中droput設置為0.1,圖卷積的中dopout設置為0.1。
4.根據權利要求1所述的基于商品評價的方面級情感分析方法,其特征在于,在步驟S3使用多頭注意力機制構建語義信息的概率注意力矩陣和句法依賴信息的概率注意力矩陣之后都進行標準化處理。
5.根據權利要求1所述的基于商品評價的方面級情感分析方法,其特征在于,在步驟S4中,參與語義信息和句法依賴信息交互的兩個向量矩陣在交互完成之后,用dropout防止過擬合,并每次交互之后標準化。
6.根據權利要求1所述的基于商品評價的方面級情感分析方法,其特征在于,在步驟S5中,在訓練階段使用交叉熵計算真實標簽和預測標簽之間的損失值,在測試階段根據預測結果表示來做模型方法的效果評估。
7.一種基于商品評價的方面級情感分析系統,其特征在于,包括:語義模塊、句法依賴模塊、信息融合交互模塊和情感極性輸出模塊四大部分,其中語義模塊包括詞嵌入層、編碼層、語義信息圖卷積層;句法依賴模塊包括句法解析層、編碼層、句法依賴信息圖卷積層;
語義模塊:詞嵌入層,主要是以高維的數字向量代表一句話中的每一個分詞標記,使用Bert進行詞向量的表示;編碼層,使用BiLSTM計算上下文語義信息的隱藏特征;語義信息圖卷積層,將融合了線性結構位置距離的上下文語義信息、樹形結構句法依賴類型信息的隱藏向量和上下文隱藏向量的概率矩陣進行圖卷積操作。
句法依賴模塊:句法解析層,使用StanfordNLP解析句子的句法依賴信息,以獲得包含依賴關系和依賴類型的句法依賴信息;編碼層,隨機初始化依賴類型的詞向量,并使用BiLSTM計算依賴類型信息的隱藏特征;句法依賴信息圖卷積層,將融合了線性結構位置距離的上下文語義信息、樹形結構句法依賴類型信息的隱藏向量和句法依賴關系類型的概率矩陣進行圖卷積操作;
信息融合交互模塊:在圖卷積的過程中,使用交互注意力充分交互語義信息和句法依賴信息;
情感極性輸出模塊:對經過特征提取和交互的最終隱藏輸出進行方面詞的MASK平均操作,然后softmax進行最后的情感預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州財經大學,未經貴州財經大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310618152.7/1.html,轉載請聲明來源鉆瓜專利網。





