[發(fā)明專利]一種微博熱點(diǎn)話題的用戶群體情感傾向遷移動(dòng)態(tài)分析方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010087323.4 | 申請(qǐng)日: | 2020-02-11 |
| 公開(kāi)(公告)號(hào): | CN111309864B | 公開(kāi)(公告)日: | 2022-08-26 |
| 發(fā)明(設(shè)計(jì))人: | 朱廣麗;張夢(mèng)瑤;朱奧強(qiáng);徐新燕;張標(biāo);張順香 | 申請(qǐng)(專利權(quán))人: | 安徽理工大學(xué) |
| 主分類號(hào): | G06F16/33 | 分類號(hào): | G06F16/33;G06F16/35;G06Q50/00 |
| 代理公司: | 北京晉德允升知識(shí)產(chǎn)權(quán)代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 232001 安徽*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 熱點(diǎn)話題 用戶 群體 情感 傾向 遷移 動(dòng)態(tài) 分析 方法 | ||
本發(fā)明提供一種微博熱點(diǎn)話題的用戶群體情感傾向遷移動(dòng)態(tài)分析方法,涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,本發(fā)明的方法先通過(guò)網(wǎng)絡(luò)爬蟲采集相關(guān)話題下的微博文本,再先后文本預(yù)處理模型、情感分析模型、異常點(diǎn)判斷、熱度分析、動(dòng)態(tài)分析獲取模型,根據(jù)這幾個(gè)模型的輸出情況,得出用戶群體的情感傾向,并記錄引起用戶群體情感遷移的事件。本發(fā)明解決了現(xiàn)有的微博用戶情感分析方法不具有時(shí)間遷移性,且容易忽略掉熱點(diǎn)話題隨時(shí)間的的情感變化,導(dǎo)致無(wú)法客觀的對(duì)微博熱點(diǎn)話題進(jìn)行情感分析的缺點(diǎn)。通過(guò)本發(fā)明可動(dòng)態(tài)揭示網(wǎng)絡(luò)群體情感傾向變化的規(guī)律,尤其是對(duì)用戶群體情感曲線異常點(diǎn)的分析,可得到引起情感遷移的事件和時(shí)間,具有一定的個(gè)人、商業(yè)和社會(huì)價(jià)值。
技術(shù)領(lǐng)域
本發(fā)明涉及一種微博熱點(diǎn)話題的用戶群體情感傾向遷移的動(dòng)態(tài)分析方法,屬于數(shù)據(jù)信息挖掘于分析。
背景技術(shù)
互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)社區(qū)的興起,讓人們?cè)絹?lái)越喜歡在網(wǎng)絡(luò)社區(qū)分享自己的生活、對(duì)熱點(diǎn)事件的態(tài)度與觀點(diǎn)。當(dāng)事件出現(xiàn)在網(wǎng)絡(luò)上并吸引人們廣泛的關(guān)注評(píng)論后會(huì)升級(jí)為熱點(diǎn)事件,成為熱點(diǎn)事件后則更容易吸引人們的關(guān)注。當(dāng)微博用戶群體關(guān)注到事件,他們會(huì)不斷的從各個(gè)方面不斷了解到事件的全貌,在這個(gè)了解事件全貌的過(guò)程中用戶會(huì)發(fā)表大量的微博文本表達(dá)自己對(duì)該事件的態(tài)度,其中不乏有對(duì)公眾情緒傾向有較高影響的話題或微博“大V”、名人博客等的加入,從而可能引起整個(gè)事件的情感傾向的遷移。找到這些事件,從個(gè)人角度講,可及時(shí)維護(hù)自身名聲利益;從商業(yè)角度講,并根據(jù)產(chǎn)品銷售后網(wǎng)絡(luò)群體情緒動(dòng)態(tài)變化的情況及時(shí)完善產(chǎn)品和進(jìn)行口碑維護(hù);從社會(huì)角度講,對(duì)網(wǎng)絡(luò)輿論進(jìn)行合理引導(dǎo),營(yíng)造和諧網(wǎng)絡(luò)環(huán)境。
現(xiàn)有的大多數(shù)對(duì)微博文本處理方法中,基本都是以個(gè)人或群體情感分析為主要研究對(duì)象,通過(guò)關(guān)鍵詞識(shí)別、詞匯關(guān)聯(lián)、統(tǒng)計(jì)方法和概念級(jí)技術(shù)對(duì)微博文本進(jìn)行情感傾向分析。考慮了微博事件隨時(shí)間變化的情感復(fù)雜性,有學(xué)者在情感分析中加入了時(shí)間序列,分析情感隨時(shí)間的變化。在網(wǎng)絡(luò)信息傳播的輿情分析中,有學(xué)者提供一種微博輿情風(fēng)險(xiǎn)研判的方法,先后通過(guò)敏感話題的識(shí)別、情感模型分析話題的正負(fù)面程度、再根據(jù)微博點(diǎn)贊、轉(zhuǎn)發(fā)和評(píng)論在一定時(shí)間內(nèi)的增加量,設(shè)置一定的閾值,對(duì)輿情分析判斷。
上述研究及后來(lái)的相關(guān)研究均沒(méi)有提出如何動(dòng)態(tài)對(duì)微博事件進(jìn)行情感分析,并找出熱點(diǎn)話題下可能在中引起用戶群體情感遷移的事件。本文提出的根據(jù)情感分析模型繪制情感變化折線圖,在動(dòng)態(tài)分析模型中自動(dòng)判斷獲取并輸出引起情感遷移的事件方法。本發(fā)明不同之處是設(shè)置了動(dòng)態(tài)分析模型,跟蹤分析熱點(diǎn)微博的情感變化,不僅可以動(dòng)態(tài)對(duì)微博事件情感傾向分析,還可根據(jù)情感曲線的異常點(diǎn)的文本處理動(dòng)態(tài)獲取引起情感波動(dòng)事件。
發(fā)明內(nèi)容
本發(fā)明的目的在于:根據(jù)用戶群體對(duì)熱點(diǎn)事件的情感遷移的問(wèn)題,本發(fā)明提供一種微博熱點(diǎn)話題的用戶群體情感傾向遷移動(dòng)態(tài)分析方法,不僅了解到用戶群體對(duì)事件的一個(gè)完整的情感趨勢(shì)圖,并且能夠找出導(dǎo)致用戶群體情感傾向大幅度遷移的原因。
為達(dá)到上述目的,本發(fā)明提供的微博熱點(diǎn)話題的用戶群體情感傾向遷移動(dòng)態(tài)分析方法包括按順序進(jìn)行的下列步驟:
(1)采集指定話題下的微博文本并對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理,包括:過(guò)濾停用詞、分詞操作;
(2)話題內(nèi)的微博文本與微博話題的相關(guān)性分析,選取與話題相關(guān)的文本;
(3)對(duì)部分微博文本進(jìn)行情感極性標(biāo)注,利用分類特征對(duì)標(biāo)注微博文本集進(jìn)行訓(xùn)練并優(yōu)化,生成SVM情感分類器,對(duì)未標(biāo)注微博文本情感極值進(jìn)行預(yù)測(cè);
(4)根據(jù)步驟(3)中利用SPSS軟件得到先前分析的用戶群體情感變化曲線圖;根據(jù)變化曲線圖找到圖中異常點(diǎn);
(5)針對(duì)步驟(4)中得到的異常點(diǎn),在其附近按時(shí)間對(duì)微博文本進(jìn)行切片分析處理,找到所有可能引起用戶群體情感傾向遷移的事件;
(6)如若在步驟(4)中沒(méi)有發(fā)現(xiàn)異常點(diǎn),則對(duì)話題進(jìn)行熱度判斷,判斷該話題是否已無(wú)熱度;
(7)動(dòng)態(tài)分析主要包含以下三個(gè)步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽理工大學(xué),未經(jīng)安徽理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010087323.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 大規(guī)模群體表演動(dòng)畫合成方法及設(shè)備
- 群體異常行為檢測(cè)方法及系統(tǒng)
- 群體異常行為檢測(cè)方法及系統(tǒng)
- 預(yù)測(cè)群體信用的方法和裝置
- 一種確定營(yíng)銷對(duì)象群體的方法及系統(tǒng)
- 群體營(yíng)銷系統(tǒng)、群體營(yíng)銷裝置及其群體營(yíng)銷方法
- 用戶群體畫像的構(gòu)建方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 群體不滿意用戶識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于改進(jìn)的SEIR模型疫情群體演變預(yù)測(cè)方法
- 基于注意力機(jī)制的群體旅游路線推薦方法





