[發明專利]一種結合微博弱關系的微博情感分析方法在審
| 申請號: | 201810248802.2 | 申請日: | 2018-03-25 |
| 公開(公告)號: | CN108595515A | 公開(公告)日: | 2018-09-28 |
| 發明(設計)人: | 楊靜;鄒曉梅;張健沛;韓宏宇;張薇 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 微博 情感分析 矩陣 文本內容 最終模型 感染性 一致性關系 關系矩陣 文本分類 綜合模型 分析器 正則化 情緒 算法 可信 社區 優化 | ||
本發明公開了一種結合微博弱關系的微博情感分析方法,屬于文本分類技術領域,包含如下步驟:步驟(1):計算微博之間的情感一致性關系矩陣,建立基于情感一致性的微博情感分析模型;步驟(2):計算微博情緒感染性矩陣,建立基于情緒感染性的微博情感分析模型;步驟(3):使用社區劃分算法,計算微博弱關系矩陣,建立基于微博弱關系的微博情感分析模型;步驟(4):結合步驟(1),步驟(2)和步驟(3),得到綜合模型,然后加入基于微博文本內容的情感分析模型并正則化,得到最終模型;步驟(5):優化最終模型,解出微博情感分析器。本發明不僅利用了微博矩陣,還考慮了微博的文本內容,更加精確可信。
技術領域
本發明屬于文本分類技術領域,尤其涉及一種結合微博弱關系的微博情感分析方法。
背景技術
《2010年中國互聯網輿情分析報告》調查顯示,2010年年度網絡熱點事件中關于“騰訊與360大戰”話題,新浪微博的回復量達到260萬條,“上海世博會”的相關評論也達到106萬條,遠遠超過新聞報道、社區、論壇的數目。2011年7月23日溫州動車事件,新浪微博相關評論達到282萬,騰訊微博也有684萬回復量。可見微博已經成為社會輿論傳播的重要媒介之一,對微博進行情感分析,是掌握網民對突發事件的情感反饋的主要手段。
隨著互聯網技術的發展,大量新型的社交平臺如Twitter、Sina、Weibo等隨之出現,它們吸引著大量用戶。用戶在這些網站上發表大量的微博,包含著他們各種各樣的觀點。而分析用戶觀點在各個領域都有重要作用和意義例如,可以通過分析用戶觀點來對股市進行預測、提高推薦系統的準確率、調查用戶對于產品的反饋、幫助政府部門進行輿情監督等。這個分析的用戶觀點的過程就稱為情感分析。
情感分類方法可以分為兩類:基于詞典的分析方法和基于機器學習的方法。基于詞典的分析方法利用情感詞典如SentiWordNet,SenticNet等對句子中的詞進行情感標記,整個文檔的情感是對其句子的詞的情感的綜合。基于詞典的情感分析方法是無監督的,并不需要事先標記的數據集,這種方法的缺點是過分依賴情感詞典,且可移植性差,與分析領域有很大關聯。基于機器學習的情感分析方法是將情感分析視為文本分類。這種方法從已經標記的文本中提取特征,然后對未知文本進行分類。這類方法通常需要大量的帶標記的訓練集,分類精度和訓練集的規模有很大關系。
但由于這些新興的社交網絡的內容是由用戶生成的,其表達方式各異,生成的句子簡短,含有大量的噪音來干擾傳統的情感分析方法。傳統的單純基于選擇不同的文本特征的方法在這種新的情境下并不適用。這些方法假設各個文本之間是相互獨立的,在社交網站上,這個假設并不成立,文本之間存在著各樣的關系。
申請號為201310506561.4的專利微博中網絡新詞抽取方法和微博情感分析方法及系統,提及一種基于詞匯抽取的微博情感分析方法,能有效對多元化情感進行表示。采用與臨床心理學相結合的方法構建情感向量,并對微博數據流進行檢測,自動發現并吸收能表示情感的網絡新詞來更新情感向量,不僅具有一定的權威性,同時也可以保證情感向量的全面性。建立情感向量的層次化結構,避免了情感向量的稀疏性;同時基于情感向量的層次結構,可對微博進行的多層次分析,能從不同角度反應公眾對突發事件的情感態度。但該方法可移植性差,不能有效地應用于其他社交工具。
申請號為201410723617.6的專利,公開了一種融合顯性和隱性特征的中文微博情感分析方法,該方法針對微博中的詞匯,表情,符號,諧音詞,簡寫詞等進行細致分析。能夠具體細致地分析出用戶微博中包含的多重情感。但該方法可操作性差。且互聯網時代,表情符號的情感歸屬難以劃分或者變化迅速,使得情感分析結果可信度下降。
發明內容
本發明的目的在于公開適用范圍廣、可移植性強的一種結合微博弱關系的微博情感分析方法。
本發明的目的是這樣實現的:
一種結合微博弱關系的微博情感分析方法,其特征在于:包含如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810248802.2/2.html,轉載請聲明來源鉆瓜專利網。





