[發明專利]一種基于背景增強的LSTM-CNN在線評論情感分類方法及系統在審
| 申請號: | 202111447487.4 | 申請日: | 2021-11-30 |
| 公開(公告)號: | CN114416969A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 孫欽東;王開宇;丁明凱 | 申請(專利權)人: | 西安交通大學;四川數字經濟產業發展研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/951;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 張宇鴿 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 背景 增強 lstm cnn 在線 評論 情感 分類 方法 系統 | ||
1.一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,包括以下步驟:
S1,采集新聞文本與其對應的在線評論文本并進行預處理;
S2,將預處理后的在線評論文本進行詞轉化得到在線評論文本的詞向量表示;
S3,將預處理后的新聞文本作為新聞文本特征提取通道的輸入,利用融合詞性與位置信息的TF-IDF算法提取新聞文本特征;
S4,將在線評論文本的詞向量表示作為評論特征提取通道的輸入,利用長短期記憶網絡提取在線評論文本的上下文時序特征,再使用卷積神經網絡提取出評論文本的局部特征;
S5,將新聞文本特征提取通道所得的新聞文本特征與在線評論文本特征提取通道所得的評論文本特征拼接得到基于背景增強的評論文本特征向量,利用評論文本特征向量訓練得到新聞評論情感分類模型,利用得到的新聞評論情感分類模型實現在線評論文本的情感極性分類。
2.根據權利要求1所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,從新聞軟件中爬取獲得新聞文本與其對應的在線評論文本數據,對采集的新聞文本以及評論文本進行預處理,具體使用正則表達式清洗數據中的特殊字符,利用jieba分詞工具對新聞文本與評論文本進行分詞處理與詞性標注,根據停用詞詞典對分詞結果進行過濾。
3.根據權利要求1所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,利用Word2vec工具對經過預處理的新聞的在線評論文本進行訓練。
4.根據權利要求3所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,采用CBOW語言模型獲得詞向量表示,將在線評論文本中的每個詞轉化為一個K維空間的稠密向量。
5.根據權利要求1所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,根據新聞文本中詞語的TF-IDF權重、詞語詞性權重和詞語位置權重計算新聞文本中每個詞語的權重,獲得新聞文本特征向量表示。
6.根據權利要求5所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,一個詞的詞性為名詞或者動名詞權重為1,如果是其他詞性權重為0.5;新聞文本中詞語位置權重:位置信息用詞跨度表示,詞跨度是指同一個詞第一次出現和最后一次出現的距離,將詞跨度進行歸一化并轉換成權重值。
7.根據權利要求1所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,將新聞評論文本詞向量表示作為長短時記憶網絡的輸入,利用長短時記憶網絡較強的上下文特征提取能力捕捉在線評論文本的上下文語義信息,保留句子間的時序信息,加強文本內部之間的聯系。
8.根據權利要求1所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,利用評論文本特征向量訓練得到新聞評論情感分類模型,將情感傾向分為積極和消極兩種情況。
9.根據權利要求8所述的一種基于背景增強的LSTM-CNN在線評論情感分類方法,其特征在于,將兩種情感傾向中概率最大值所屬的情感傾向當作本發明所提模型對新聞評論文本句子情感極性的預測結果;
y=soft max(WTx+b)
yi=soft max(wjx+bj)
式中,x為全連接層的輸入,Wn×k為權重,b為偏置項,y為softmax輸出的概率。
10.一種基于權利要求1所述方法的在線評論情感分類系統,其特征在于,包括預處理模塊,特征提取融合模塊和分類模塊;
預處理模塊用于對采集的新聞文本與其對應的在線評論文本進行預處理,并將預處理后的在線評論文本進行詞轉化得到在線評論文本的詞向量表示;
特征提取融合模塊用于將預處理后的新聞文本作為新聞文本特征提取通道的輸入,利用融合詞性與位置信息的TF-IDF算法提取新聞文本特征;將在線評論文本的詞向量表示作為評論特征提取通道的輸入,利用長短期記憶網絡提取在線評論文本的上下文時序特征,再使用卷積神經網絡提取出評論文本的局部特征;
分類模塊用于根據新聞文本特征提取通道所得的新聞文本特征與在線評論文本特征提取通道所得的評論文本特征拼接得到基于背景增強的評論文本特征向量,利用評論文本特征向量訓練得到新聞評論情感分類模型,利用得到的新聞評論情感分類模型實現在線評論文本的情感極性分類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學;四川數字經濟產業發展研究院,未經西安交通大學;四川數字經濟產業發展研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111447487.4/1.html,轉載請聲明來源鉆瓜專利網。





