[發(fā)明專利]一種基于人機(jī)協(xié)作的微博事件真假檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202110284557.2 | 申請(qǐng)日: | 2021-03-17 |
| 公開(kāi)(公告)號(hào): | CN113064991A | 公開(kāi)(公告)日: | 2021-07-02 |
| 發(fā)明(設(shè)計(jì))人: | 於志文;楊曼媛;楊帆;郭斌;王亮 | 申請(qǐng)(專利權(quán))人: | 西北工業(yè)大學(xué) |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06F16/95 |
| 代理公司: | 西北工業(yè)大學(xué)專利中心 61204 | 代理人: | 金鳳 |
| 地址: | 710072 *** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 人機(jī) 協(xié)作 事件 真假 檢測(cè) 方法 | ||
1.一種基于人機(jī)協(xié)作的微博事件真假檢測(cè)方法,其特征在于,包括以下步驟:
步驟1:在微博上對(duì)數(shù)據(jù)進(jìn)行采集,包括微博主體、評(píng)論、發(fā)表微博以及評(píng)論的用戶信息數(shù)據(jù),用戶信息數(shù)據(jù)如表1;
表1用戶數(shù)據(jù)信息
步驟2:對(duì)用戶進(jìn)行可信度檢測(cè);
步驟2-1:根據(jù)用戶是否填寫(xiě)相應(yīng)信息將用戶的信息處理為二元屬性,若填寫(xiě)了相應(yīng)的信息,取值為1,否則取值為0,表示為:
其中f(i)表示二元處理的結(jié)果,Ui表示用戶的靜態(tài)信息可信度,n表示需要處理的信息數(shù)量;
步驟2-2:將微博、粉絲、關(guān)注、互關(guān)、好友情況進(jìn)行數(shù)據(jù)規(guī)約和數(shù)據(jù)變換處理;
步驟2-2-1:延伸出漲粉速率Vfo以及微博活躍度Vtw兩個(gè)指標(biāo),計(jì)算公式如下:
其中,fonum為粉絲數(shù)量,twnum為微博數(shù)量,Uv表示用戶活躍度的可信度;
步驟2-2-2:通過(guò)分析微博用戶互粉數(shù)、關(guān)注數(shù)、粉絲數(shù),進(jìn)行數(shù)據(jù)變換,延伸出互粉比例系數(shù)BiFo特征指標(biāo):
其中,Bifo(.)表示互粉比例系數(shù),F(xiàn)o(.)表示關(guān)注數(shù)量,a表示每個(gè)特征的系數(shù),i、j分別表示用戶的不同特征數(shù)值與用戶某一時(shí)刻特征的數(shù)值,z表示求取最大特征數(shù)值對(duì)應(yīng)的序號(hào);Num(.)表示微博數(shù)量Tw、關(guān)注數(shù)量Fo、互粉量數(shù)Bf、好友數(shù)量Fr四個(gè)指標(biāo)之一;
分別用微博數(shù)量Tw、關(guān)注數(shù)量Fo、互粉量數(shù)Bf、好友數(shù)量Fr四個(gè)指標(biāo)作為Num(.)代入式(3),得到每個(gè)指標(biāo)對(duì)應(yīng)的判斷用戶可信度的特征,之后將其相加得到對(duì)用戶的可信度影響因子評(píng)估如下:
步驟2-3:計(jì)算用戶的可信度UC:
UC=(θ(Ui),θ(Uv),θ(Ur))
其中θ(x)為遞減函數(shù),t1表示時(shí)間,p表示時(shí)間系數(shù);
步驟3:對(duì)微博的文本內(nèi)容進(jìn)行情緒分?jǐn)?shù)檢測(cè);
其中,t為指數(shù),t的值取決于是否極性反轉(zhuǎn);k代表程度詞的程度,word(j)表示每個(gè)詞的原始分?jǐn)?shù),ρ表示每部分積極詞或消極詞的頻率m、n分別表示否定詞與程度副詞的數(shù)量;
步驟4:對(duì)微博事件進(jìn)行建模,將微博事件構(gòu)造成一個(gè)由用戶、微博正文和評(píng)論作為節(jié)點(diǎn)交互的四層網(wǎng)絡(luò)結(jié)構(gòu);具體建模過(guò)程如下:
將同樣角度的微博進(jìn)行聚類(lèi),構(gòu)成子事件,將不同子事件的聚類(lèi)中心進(jìn)行連接,所構(gòu)成的邊用聚類(lèi)中心的余弦相似度作為度量;
對(duì)子事件內(nèi)部的微博,微博之間邊的權(quán)值決定了兩條微博之間的相互影響情況,兩條微博相似度越高,他們邊的權(quán)重就越大,通過(guò)杰卡德相似度對(duì)其邊進(jìn)行計(jì)算;
評(píng)論是用戶對(duì)事件微博的外在評(píng)定,一條評(píng)論對(duì)于微博的影響程度來(lái)自于評(píng)論與微博的一致程度,使用余弦相似度作為微博與評(píng)論的邊進(jìn)行差異度量;
對(duì)相同用戶的發(fā)言建立邊的連接,使用杰卡德方法對(duì)其進(jìn)行度量;
最終構(gòu)成的圖G=(E,V)即是以節(jié)點(diǎn)和邊為基本數(shù)據(jù)組的拓?fù)浣Y(jié)構(gòu);
步驟5:使用GCN對(duì)圖模型G(N,E)進(jìn)行處理;
在圖G(N,E)中,節(jié)點(diǎn)N的輸入為用戶的可信度、文本的情感評(píng)估分?jǐn)?shù),邊E的輸入為不同實(shí)體之間的相似度度量結(jié)果;FGCN的鄰接矩陣A是n維方陣,n代表圖中節(jié)點(diǎn)數(shù)量,A中每個(gè)元素表示兩個(gè)節(jié)點(diǎn)之間的權(quán)重;處理過(guò)程中,在GCN中加入類(lèi)鄰接矩陣,對(duì)同階的鄰域節(jié)點(diǎn)加權(quán)分配鄰居權(quán)重;
步驟6:根據(jù)微博與子事件中心微博的相似度絕對(duì)值大小對(duì)微博進(jìn)行提取,提出超過(guò)相似度絕對(duì)值的微博,所提取出的微博分為以下三種情況:
1、微博文本為用戶本人的主觀評(píng)價(jià),用戶針對(duì)事件進(jìn)行了討論,微博本身與事件相關(guān),因此不做任何處理;
2、微博中雖然包含對(duì)事件的評(píng)價(jià),但是其中夾雜著廣告,將這種情況的微博直接刪除;
3、偏移事件的主題,行文過(guò)程中轉(zhuǎn)向?qū)ζ渌挛锏脑u(píng)價(jià);若超過(guò)一半的微博篇幅與評(píng)論都用來(lái)描述與主題不相干事件,對(duì)微博進(jìn)行刪除;若微博正文內(nèi)僅僅提到了另外的事件,則將其評(píng)論中不相干的評(píng)論進(jìn)行刪除,保證微博的評(píng)論中只包含對(duì)相關(guān)事件的看法;
步驟7:將經(jīng)過(guò)步驟6處理過(guò)的微博事件重新進(jìn)行聚類(lèi),重復(fù)一次步驟4到步驟6,生產(chǎn)新的圖模型,使用GCN對(duì)新的圖模型進(jìn)行處理,得到最后的檢測(cè)結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于人機(jī)協(xié)作的微博事件真假檢測(cè)方法,其特征在于,所述步驟6中的相似度的絕對(duì)值大小為0.15。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北工業(yè)大學(xué),未經(jīng)西北工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110284557.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種人機(jī)命令隊(duì)列管理系統(tǒng)和方法
- 無(wú)人機(jī)監(jiān)控方法、系統(tǒng)以及無(wú)人機(jī)和地面站
- 無(wú)人機(jī)拍攝方法及裝置、無(wú)人機(jī)和地面控制裝置
- 一種確定無(wú)人機(jī)飛行路徑的方法及裝置
- 一種執(zhí)行任務(wù)時(shí)無(wú)人機(jī)群數(shù)據(jù)鏈真實(shí)性檢測(cè)方法
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 用于無(wú)人機(jī)超視距管控的系統(tǒng)及其工作方法
- 一種有人機(jī)與無(wú)人機(jī)的組合系統(tǒng)
- 連發(fā)無(wú)人機(jī)電磁彈射系統(tǒng)及無(wú)人機(jī)機(jī)庫(kù)
- 無(wú)人機(jī)的控制方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及無(wú)人機(jī)
- 一種基于業(yè)務(wù)規(guī)則的跨部門(mén)流程協(xié)同方法
- 基站協(xié)作的動(dòng)態(tài)連接方法、基站和協(xié)作多輸入多輸出系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸系統(tǒng)的信號(hào)發(fā)送方法及其裝置
- 協(xié)作方法、網(wǎng)絡(luò)和用戶終端
- 應(yīng)用程序協(xié)作系統(tǒng)、應(yīng)用程序協(xié)作方法以及應(yīng)用程序協(xié)作程序
- 協(xié)作多點(diǎn)傳輸方法、裝置和系統(tǒng)
- 一種面向智能終端的內(nèi)容下載應(yīng)用激勵(lì)方法及其系統(tǒng)
- 一種協(xié)作多點(diǎn)傳輸調(diào)度方法及裝置
- 一種協(xié)作實(shí)現(xiàn)方法和裝置
- 一種區(qū)塊鏈及智能合約系統(tǒng)協(xié)作層設(shè)計(jì)
- 一種事件通訊裝置及方法
- 動(dòng)態(tài)權(quán)重事件處理系統(tǒng)和方法
- 攻擊檢測(cè)裝置和攻擊檢測(cè)方法
- 基于Unity的事件管理方法及系統(tǒng)
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 事件解析裝置、事件解析系統(tǒng)、事件解析方法及事件解析程序
- 熱點(diǎn)事件確定方法及裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種樹(shù)狀模型中節(jié)點(diǎn)的連接方法及其模型、計(jì)算機(jī)裝置和可讀存儲(chǔ)介質(zhì)
- 一種事件處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





