[發(fā)明專利]一種微博熱點話題的用戶群體情感傾向遷移動態(tài)分析方法有效
| 申請?zhí)枺?/td> | 202010087323.4 | 申請日: | 2020-02-11 |
| 公開(公告)號: | CN111309864B | 公開(公告)日: | 2022-08-26 |
| 發(fā)明(設(shè)計)人: | 朱廣麗;張夢瑤;朱奧強;徐新燕;張標(biāo);張順香 | 申請(專利權(quán))人: | 安徽理工大學(xué) |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06Q50/00 |
| 代理公司: | 北京晉德允升知識產(chǎn)權(quán)代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 232001 安徽*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 熱點話題 用戶 群體 情感 傾向 遷移 動態(tài) 分析 方法 | ||
1.一種微博熱點話題的用戶群體情感傾向遷移動態(tài)分析方法,其特征在于,包括如下步驟:
步驟(1):采集指定話題下的微博文本并對文本數(shù)據(jù)進行預(yù)處理,包括過濾停用詞、分詞操作;
步驟(2):對上述采集的話題下的微博文本與微博話題的相關(guān)性分析,選取與話題相關(guān)的文本;
步驟(3):對部分微博文本進行情感極性標(biāo)注,利用分類特征對標(biāo)注微博文本集進行訓(xùn)練并優(yōu)化,生成SVM情感分類器,對未標(biāo)注微博文本情感極值進行預(yù)測;
步驟(4):基于所述步驟(3)中預(yù)測得到的情感極值,利用SPSS軟件得到先前分析的用戶群體情感變化曲線圖;根據(jù)變化曲線圖找到圖中異常點;
步驟(5):針對步驟(4)得到的異常點,在其附近按時間對微博文本進行切片分析處理,具體包括:針對步驟(4)得到的異常點,和異常點所在的時間信息,按照這個時間向前獲取一小時內(nèi)的微博文本,對文本按時間切片,每十分鐘為一組,劃分為12組;對切片文本進行分析處理具體包括下列步驟:
1)以十分鐘為一個時間切片,分析是否有擁有較高話語權(quán)且在較高程度上影響著公眾情緒和決策行為的方向角色加入,與此同時,擁有一定意見引導(dǎo)能力和話題響應(yīng)度的網(wǎng)絡(luò)個體更是通過網(wǎng)絡(luò)平臺對其跟隨者的觀點態(tài)度造成影響;2)記錄所有可能引起用戶群體情感傾向遷移的事件;
步驟(6):如若在步驟(4)中沒有發(fā)現(xiàn)異常點,則對話題進行熱度判斷,判斷該話題是否已無熱度;具體包括:
若在步驟(4)中沒有發(fā)現(xiàn)異常點,則對該話題進行熱度判斷,判斷該話題是否已無熱度;根據(jù)一天時間內(nèi)此微博事件的轉(zhuǎn)發(fā)量、點贊數(shù)、評論數(shù)、閱讀量的增加量,和熱點事件持續(xù)的時間計算熱度;結(jié)合不同指標(biāo)在微博事件中的影響程度不同,對不同指標(biāo)設(shè)置不同的權(quán)重,具體熱度計算公式如下:
其中,Et、Es、Ec、Er分別是當(dāng)前獲取一天時間內(nèi)的此微博事件的轉(zhuǎn)發(fā)量、點贊量、評論數(shù)和閱讀量的增加量,T、S、C、R、d分別是微博事件總的轉(zhuǎn)發(fā)量、點贊量、評論數(shù)、閱讀量和持續(xù)天數(shù),當(dāng)微博轉(zhuǎn)發(fā)、評論、點贊量和閱讀量不是一個數(shù)量級時,在計算中讓閱讀量除以1000以平衡數(shù)量級;如果輸出的熱度值大于或等于18%,則判定該事件仍有熱度,進入步驟(7),進行動態(tài)分析;否則判該事件暫時沒有熱度,根據(jù)需要,人為選擇結(jié)束事件的分析或繼續(xù)關(guān)注此事件的后續(xù)發(fā)展情況;
步驟(7):動態(tài)分析包括以下幾步:
1)根據(jù)異常點切片處理結(jié)果找出引起變化的事件和時間,具體包括下列步驟:
1.1)按時間序列選取異常點前1小時內(nèi)的文本,對文本按分鐘進行排序、處理、分析接受到步驟(5)中記錄的所有可能引起用戶群體情感傾向遷移的事件后,將事件相關(guān)度進行判斷,相關(guān)度高的事件劃分為一類;
1.2)再將異常點前一小時內(nèi)的微博文本與劃分好類別的可能引起用戶群體情感傾向遷移的事件進行相關(guān)度分析,將相關(guān)聯(lián)的文本信息進行歸類;
1.3)計算可能引起情感傾向的話題的影響力在這段時間總事件中的影響力占比,得到具體影響情感傾向遷移的事件;
2)事件切片的動態(tài)分析:處理完當(dāng)前切片后自動繼續(xù)后續(xù)切片的分析處理,直至截取的此事件片段分析完;
3)時間段的動態(tài)獲取:處理完當(dāng)前時間段的微博文本后自動再次獲取新一輪的2小時微博文本,進入數(shù)據(jù)預(yù)處理模型,若當(dāng)前時間段仍有文本正在處理,則等到文本處理完成后再次獲取新一輪2小時微博文本;
(8)獲取新的2小時微博文本后,重復(fù)上述步驟;
(9)根據(jù)情感趨勢折線圖,預(yù)測未來短時間內(nèi)情感的可能變化趨勢。
2.根據(jù)權(quán)利要求1所述的一種微博熱點話題的用戶群體情感傾向遷移動態(tài)分析方法,其特征在于:步驟2對微博文本與話題相關(guān)性分析主要是利用TF-IDF-SIM法計算微博文本與特定話題的相似程度;對微博文本進行分詞之后,統(tǒng)計每個詞在微博文本中出現(xiàn)的頻率TF和逆文檔頻率IDF,根據(jù)TF-IDF的值來選取靠前的詞作為文本關(guān)鍵詞,SIM是計算關(guān)鍵詞與當(dāng)前話題詞的相似度值。
3.根據(jù)權(quán)利要求1所述的一種微博熱點話題的用戶群體情感傾向遷移動態(tài)分析方法,其特征在于:步驟(3)對為標(biāo)注文本進行情感預(yù)測方法為:首先進行特征提取,選取包括情感詞、否定詞、網(wǎng)絡(luò)用語程度副詞和表情符號作為分類特征,進行訓(xùn)練優(yōu)化生成SVM分類器;接著利用SVM分類器預(yù)測得到微博情感極性。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽理工大學(xué),未經(jīng)安徽理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010087323.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





