[發明專利]一種基于主題的輿情情感演化的方法在審
| 申請號: | 201910536657.2 | 申請日: | 2019-06-20 |
| 公開(公告)號: | CN111143549A | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 夏小玲;石秀金;王紹宇;吳永博 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33;G06F16/38 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 主題 輿情 情感 演化 方法 | ||
本發明提供一種基于主題的輿情情感演化的方法,涉及自然語言處理領域。該方法主要步驟:利用爬蟲技術從網絡上獲取輿情語料數據;對語言數據的預處理;對預料信息進行詞向量訓練并且判斷出詞向量間相似度,并且進行離散的時間片劃分;通過計算不同時間片內輿情的話題熱度以及話題相對熵等度量指標,判斷輿情熱點熱度變化以及相鄰時間片內的輿情主題內容相關性;結合輿情信息的特點,將輿情主題作為增強特征,與文本特征結合起來輸入到聯合深度神經網絡模型中進行情感分類;根據輿情話題演化模型獲得的熱點話題,對各熱點話題不同評價對象的情感傾向進行抽取;對不同時間片內熱點話題各評論對象的情感傾向進行對比分析。
技術領域
本發明涉及一種基于主題的輿情情感演化的方法,屬于自然語言處理及深度學習領域。
背景技術
情感分析也被稱為情感挖掘、意見挖掘、觀點抽取等,是指用自然語言處理、文本挖掘的方法來對文本信息中包含主管情感極性的文本信息進行分析、處理,然后歸納總結并推理,最終挖掘出作者的觀點、情感、評價、態度等信息的過程。近些年來文本情感分析受到學術界越來越高的重視,例如國外有著名的國際語義評測會議(SemEval)每年都會有對文本進行情感傾向性判斷的測評任務。在國內,由于中文文本的復雜性導致研究起步較晚,但在中文分詞技術得到提高后,發展速度開始變快,也出現了類似的中文情感傾向性測評會議(COAE)。這些測評會議發布的評測任務促進了國內外文本情感分析的發展。目前中文文本情感傾向分析主要分為以情感詞典和語義規則為主和以機器學習為主兩種方法,隨著深度學習的迅速發展,深度學習方法也被應用于自然語言處理研究中,并取得了突出的研究成果。
在傳統的基于文本統計和知識字典的研究方法中不考慮詞語之間的關聯,把文本當作是詞語的集合,首先對情感詞典進行構建,然后根據詞典將目標文本中的情感詞進行抽取,對目標文本進行段落拆解、句法分析,基于制定好的情感計算規則將文本中的詞語與情感詞典進行匹配,根據結果得到文本的情感分類。因此如何構造一個高質量的情感詞典至關重要。目前構造情感詞典的方法主要分為人工標注和自動構建兩種方法,中文常用的情感詞典主要有知網的HowNet和哈工大的《同義詞詞林》等。
但是基于情感詞典的分析方法并不再適用于當今各種網絡詞語大量涌現的時代,它過度依賴于情感詞典的構建,而如今很難對構建好的情感詞典進行更新和完善,人工添加的方法費時費力,同時這種方法忽略了上下文之間信息的關聯,因此準確性也很低。
Pang等人最先使用不同的機器學習算法來解決情感分析問題,分類結果高于基于詞典的方法。由于機器學習分類方法是有監督的學習,因此需要對語料進行大量標注然后再進行模型訓練,不依賴于情感詞典的構建,可以自動提取文本特征。常用的機器學習模型有邏輯回歸模型、支持向量機、最大熵模型等方法。 Boiy等人使用最大熵模型等多種機器學習方法對情感信息進行挖掘;Ye等人對不同的機器學習算法進行比較,發現使用支持向量機和N-grame模型的準確率遠遠高于其他機器學習算法;Wang等人根據文本主題將數據集分割,在每個主題的數據集上單獨進行機器學習的模型訓練,有效的提高了文本的分類準確率;魏晶晶等利用SVM算法進行電商購物評論的情感分析,結果表明比一般的統計方法準確率有所提高。以上為有監督的機器學習算法,依賴于人工標注文本分類,無監督的機器學習方法有K-means、 OPTICS(OrderingPointToIdentifytheClusterStructure)等聚類方法,通過自動學習數據之間潛在的相似性來進行分類,不需要人工標注特征。如Zagibalov等人通過自動選擇種子詞,實現了對中國商品評論的無監督情感分類。該方法降低了人工標注所浪費的人力物力,但是準確率與有監督的機器學習方法相比要低。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910536657.2/2.html,轉載請聲明來源鉆瓜專利網。





