[發明專利]一種微博熱點話題的用戶群體情感傾向遷移動態分析方法有效
| 申請號: | 202010087323.4 | 申請日: | 2020-02-11 |
| 公開(公告)號: | CN111309864B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 朱廣麗;張夢瑤;朱奧強;徐新燕;張標;張順香 | 申請(專利權)人: | 安徽理工大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06Q50/00 |
| 代理公司: | 北京晉德允升知識產權代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 232001 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 熱點話題 用戶 群體 情感 傾向 遷移 動態 分析 方法 | ||
1.一種微博熱點話題的用戶群體情感傾向遷移動態分析方法,其特征在于,包括如下步驟:
步驟(1):采集指定話題下的微博文本并對文本數據進行預處理,包括過濾停用詞、分詞操作;
步驟(2):對上述采集的話題下的微博文本與微博話題的相關性分析,選取與話題相關的文本;
步驟(3):對部分微博文本進行情感極性標注,利用分類特征對標注微博文本集進行訓練并優化,生成SVM情感分類器,對未標注微博文本情感極值進行預測;
步驟(4):基于所述步驟(3)中預測得到的情感極值,利用SPSS軟件得到先前分析的用戶群體情感變化曲線圖;根據變化曲線圖找到圖中異常點;
步驟(5):針對步驟(4)得到的異常點,在其附近按時間對微博文本進行切片分析處理,具體包括:針對步驟(4)得到的異常點,和異常點所在的時間信息,按照這個時間向前獲取一小時內的微博文本,對文本按時間切片,每十分鐘為一組,劃分為12組;對切片文本進行分析處理具體包括下列步驟:
1)以十分鐘為一個時間切片,分析是否有擁有較高話語權且在較高程度上影響著公眾情緒和決策行為的方向角色加入,與此同時,擁有一定意見引導能力和話題響應度的網絡個體更是通過網絡平臺對其跟隨者的觀點態度造成影響;2)記錄所有可能引起用戶群體情感傾向遷移的事件;
步驟(6):如若在步驟(4)中沒有發現異常點,則對話題進行熱度判斷,判斷該話題是否已無熱度;具體包括:
若在步驟(4)中沒有發現異常點,則對該話題進行熱度判斷,判斷該話題是否已無熱度;根據一天時間內此微博事件的轉發量、點贊數、評論數、閱讀量的增加量,和熱點事件持續的時間計算熱度;結合不同指標在微博事件中的影響程度不同,對不同指標設置不同的權重,具體熱度計算公式如下:
其中,Et、Es、Ec、Er分別是當前獲取一天時間內的此微博事件的轉發量、點贊量、評論數和閱讀量的增加量,T、S、C、R、d分別是微博事件總的轉發量、點贊量、評論數、閱讀量和持續天數,當微博轉發、評論、點贊量和閱讀量不是一個數量級時,在計算中讓閱讀量除以1000以平衡數量級;如果輸出的熱度值大于或等于18%,則判定該事件仍有熱度,進入步驟(7),進行動態分析;否則判該事件暫時沒有熱度,根據需要,人為選擇結束事件的分析或繼續關注此事件的后續發展情況;
步驟(7):動態分析包括以下幾步:
1)根據異常點切片處理結果找出引起變化的事件和時間,具體包括下列步驟:
1.1)按時間序列選取異常點前1小時內的文本,對文本按分鐘進行排序、處理、分析接受到步驟(5)中記錄的所有可能引起用戶群體情感傾向遷移的事件后,將事件相關度進行判斷,相關度高的事件劃分為一類;
1.2)再將異常點前一小時內的微博文本與劃分好類別的可能引起用戶群體情感傾向遷移的事件進行相關度分析,將相關聯的文本信息進行歸類;
1.3)計算可能引起情感傾向的話題的影響力在這段時間總事件中的影響力占比,得到具體影響情感傾向遷移的事件;
2)事件切片的動態分析:處理完當前切片后自動繼續后續切片的分析處理,直至截取的此事件片段分析完;
3)時間段的動態獲取:處理完當前時間段的微博文本后自動再次獲取新一輪的2小時微博文本,進入數據預處理模型,若當前時間段仍有文本正在處理,則等到文本處理完成后再次獲取新一輪2小時微博文本;
(8)獲取新的2小時微博文本后,重復上述步驟;
(9)根據情感趨勢折線圖,預測未來短時間內情感的可能變化趨勢。
2.根據權利要求1所述的一種微博熱點話題的用戶群體情感傾向遷移動態分析方法,其特征在于:步驟2對微博文本與話題相關性分析主要是利用TF-IDF-SIM法計算微博文本與特定話題的相似程度;對微博文本進行分詞之后,統計每個詞在微博文本中出現的頻率TF和逆文檔頻率IDF,根據TF-IDF的值來選取靠前的詞作為文本關鍵詞,SIM是計算關鍵詞與當前話題詞的相似度值。
3.根據權利要求1所述的一種微博熱點話題的用戶群體情感傾向遷移動態分析方法,其特征在于:步驟(3)對為標注文本進行情感預測方法為:首先進行特征提取,選取包括情感詞、否定詞、網絡用語程度副詞和表情符號作為分類特征,進行訓練優化生成SVM分類器;接著利用SVM分類器預測得到微博情感極性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽理工大學,未經安徽理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010087323.4/1.html,轉載請聲明來源鉆瓜專利網。





