[發明專利]一種基于背景增強的LSTM-CNN在線評論情感分類方法及系統在審
| 申請號: | 202111447487.4 | 申請日: | 2021-11-30 |
| 公開(公告)號: | CN114416969A | 公開(公告)日: | 2022-04-29 |
| 發明(設計)人: | 孫欽東;王開宇;丁明凱 | 申請(專利權)人: | 西安交通大學;四川數字經濟產業發展研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/951;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 張宇鴿 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 背景 增強 lstm cnn 在線 評論 情感 分類 方法 系統 | ||
本發明公開了一種基于背景增強的LSTM?CNN在線評論情感分類方法及系統,將預處理后的在線評論文本進行詞轉化得到在線評論文本的詞向量表示,利用融合詞性與位置信息的TF?IDF算法提取新聞文本特征,使用卷積神經網絡提取出評論文本的局部特征,將新聞文本特征提取通道所得的新聞文本特征與在線評論文本特征提取通道所得的評論文本特征拼接得到基于背景增強的評論文本特征向量,將評論文本作為語言背景,將其作為評論文本情感分析的特征,加入到情感分類模型中,提高了模型在不同背景下情感分析判斷能力,使用TF?IDF結合詞性與位置信息進行新聞文本特征提取,融合特征向量然后進入全連接層分類訓練得到新聞評論情感分類模型,能夠提高新聞評論情感分類的準確率。
技術領域
本發明屬于自然語言處理和深度學習領域,具體涉及一種基于背景增強的 LSTM-CNN在線評論情感分類方法及系統。
背景技術
隨著信息科技的快速發展以及互聯網普及率的持續提升,網絡已經逐步成 為大眾日常生活中獲取社會信息和參與社會熱點討論的主要方式,并且在經濟 政治社會生活中發揮著越來越重要的影響。2017年到2020年我國網絡新聞 的用戶規模以及在網民總數中的占比都在逐漸增加,這充分體現了我國大多數 網民愿意主動了解社會熱點新聞,對于網絡新聞事件的關注度越來越高,這說 明了網民樂于對各種新聞表達自己的想法,對于參與網絡話題的熱情很高。互 聯網時代使得網絡信息爆炸性增長,面對海量的在線評論數據進行研究具有重 要的現實意義。
在當前網民擁有相對自由的話語權的環境下,輿情在網絡新媒體中愈演愈 烈,在新媒體平臺上發布一條熱點事件,短時間內就會產生成千上萬的評論, 公眾暢所欲言,充斥著公正性、針對性、虛假性、煽動性、誤導性等的多類型 言論,如果不嚴格把控言論、了解民意,將會造成事件的惡化,輿論的激化。 因此有效挖掘新聞在線評論,對于評論走向,輿情發展都有很重要的作用。
當前主流的在線評論情感分類方法包括基于情感詞典的情感分類、基于傳 統機器學習的情感分類和基于深度學習的分類方法。前面兩種情感分類方法需 要較多的人工先驗知識的輔助,通過提取大量人工特征和構建情感詞典完成情 感分類任務。雖然這兩種方法處理效果較為理想,但過程繁瑣。而基于深度學 習的情感分類方法能夠自動提取特征,處理過程簡便,且情感分類效果更好, 因此,越來越多的人采用基于深度學習的方法處理情感分類問題。新聞在線評 論的內容具有迫切的現實意義,主要是針對當前重要的新聞事件和現實生活中 的問題包括人民群眾中的某些熱點、難點問題發表意見。在線評論與群眾緊密 相連,反映了大眾對于事件的要求和呼聲,也代表群眾的特點和需要。新聞評 論往往含有對于某件事情的態度,不同于對產品發表的評論,新聞評論中的情 感傾向往往需要依賴新聞文本作為背景來綜合考慮,分析沒有上下文的新聞評 論的情感非常困難,很可能會誤解句子的真正情感信息,并且某種程度上還會 造成情感極性的誤解,因此,急需一種能夠快速準確實現評論情感分類的方法, 將在線評論進行有效分類歸結,了解事件動態發展。
發明內容
本發明的目的在于提供一種基于背景增強的LSTM-CNN在線評論情感分 類方法及系統,以克服現有技術的不足。
一種基于背景增強的LSTM-CNN在線評論情感分類方法,包括以下步驟:
S1,采集新聞文本與其對應的在線評論文本并進行預處理;
S2,將預處理后的在線評論文本進行詞轉化得到在線評論文本的詞向量表 示;
S3,將預處理后的新聞文本作為新聞文本特征提取通道的輸入,利用融合 詞性與位置信息的TF-IDF算法提取新聞文本特征;
S4,將在線評論文本的詞向量表示作為評論特征提取通道的輸入,利用長 短期記憶網絡提取在線評論文本的上下文時序特征,再使用卷積神經網絡提取 出評論文本的局部特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學;四川數字經濟產業發展研究院,未經西安交通大學;四川數字經濟產業發展研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111447487.4/2.html,轉載請聲明來源鉆瓜專利網。





