[發(fā)明專利]一種基于樸素貝葉斯模型的謠言識(shí)別方法有效
| 申請?zhí)枺?/td> | 201811200240.0 | 申請日: | 2018-10-16 |
| 公開(公告)號: | CN109558483B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 李大慶;鐘季龍 | 申請(專利權(quán))人: | 北京航空航天大學(xué) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06K9/62;G06Q50/00 |
| 代理公司: | 北京慧泉知識(shí)產(chǎn)權(quán)代理有限公司 11232 | 代理人: | 王順榮;唐愛華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 樸素 貝葉斯 模型 謠言 識(shí)別 方法 | ||
1.一種基于樸素貝葉斯模型的謠言識(shí)別方法,其特征在于:其具體實(shí)施步驟如下:
步驟1,采集樣本數(shù)據(jù),構(gòu)建消息轉(zhuǎn)發(fā)網(wǎng)絡(luò)
首先采集樣本數(shù)據(jù),用于學(xué)習(xí)訓(xùn)練,根據(jù)轉(zhuǎn)發(fā)消息的用戶,建立消息轉(zhuǎn)發(fā)網(wǎng)絡(luò),為進(jìn)一步識(shí)別活躍用戶做好數(shù)據(jù)準(zhǔn)備,包括2個(gè)子步驟:
1.1采集樣本數(shù)據(jù),并按標(biāo)簽進(jìn)行分類;
1.2定義網(wǎng)絡(luò)節(jié)點(diǎn)與連邊形式,構(gòu)建消息轉(zhuǎn)發(fā)網(wǎng)絡(luò);
步驟2,統(tǒng)計(jì)識(shí)別謠言轉(zhuǎn)發(fā)網(wǎng)絡(luò)的活躍用戶
每一條消息形成一個(gè)消息轉(zhuǎn)發(fā)網(wǎng)絡(luò),網(wǎng)絡(luò)中存在一些參與不同轉(zhuǎn)發(fā)網(wǎng)絡(luò)的用戶,對于謠言轉(zhuǎn)發(fā)網(wǎng)絡(luò),通過識(shí)別這些活躍用戶,進(jìn)一步進(jìn)行基于樸素貝葉斯模型的謠言轉(zhuǎn)發(fā)網(wǎng)絡(luò)識(shí)別,包括2個(gè)子步驟:
2.1定義謠言轉(zhuǎn)發(fā)的用戶活躍度;
2.2統(tǒng)計(jì)并篩選謠言轉(zhuǎn)發(fā)網(wǎng)絡(luò)中的所有活躍用戶;
步驟3,確定謠言識(shí)別的條件概率計(jì)算公式
為判定一條消息是否屬于謠言,需根據(jù)樸素貝葉斯模型確定謠言識(shí)別的條件概率計(jì)算公式,并在此基礎(chǔ)上進(jìn)行進(jìn)一步簡化公式;條件獨(dú)立性假設(shè)是樸素貝葉斯模型中“樸素”一詞的來源,該假設(shè)目的在于簡化聯(lián)合概率的求解計(jì)算,引入該假設(shè)后,聯(lián)合概率計(jì)算就轉(zhuǎn)化為各自獨(dú)立概率的乘積的形式,即
P(x1,x2,...,xn|y)=P(x1|y)P(x2|y)...P(xn|y),
式中:P(x1,x2,...,xn|y)表示y條件下事件x1,x2,...,xn同時(shí)發(fā)生的聯(lián)合概率,P(x1|y)表示y條件下事件x1發(fā)生的概率,類似的,P(xn|y)表示y條件下事件xn發(fā)生的概率;
包括2個(gè)子步驟:
3.1根據(jù)條件概率計(jì)算的一般公式,確定謠言識(shí)別的條件概率計(jì)算公式;
3.2引入條件獨(dú)立性假設(shè),簡化謠言識(shí)別的條件概率計(jì)算公式;
在步驟3.1中的做法如下:根據(jù)條件概率計(jì)算的一般公式
其中X表示特征,Y表示類別標(biāo)簽,P(Y)稱為先驗(yàn)概率,P(Y|X)稱為后驗(yàn)概率,P(X)表示特征的概率,P(X|Y)表示Y類別中X特征的概率,從消息轉(zhuǎn)發(fā)的活躍用戶出發(fā),將謠言識(shí)別的條件概率計(jì)算公式表示為
其中Ki表示活躍用戶,P(Rumor|K1,K2...,Kn)表示一組活躍用戶(K1,K2...,Kn)在同時(shí)參與一條消息轉(zhuǎn)發(fā)的條件下,該消息為謠言的條件概率,即后驗(yàn)概率,P(K1,K2...Kn|Rumor)表示謠言轉(zhuǎn)發(fā)網(wǎng)絡(luò)中活躍用戶(K1,K2...,Kn)同時(shí)參與轉(zhuǎn)發(fā)的聯(lián)合概率,P(Rumor)表示樣本空間中謠言所占的比例,即先驗(yàn)概率,P(K1,K2...,Kn)表示活躍用戶參與轉(zhuǎn)發(fā)的聯(lián)合概率。
2.根據(jù)權(quán)利要求1所述的一種基于樸素貝葉斯模型的謠言識(shí)別方法,其特征在于:
在步驟1.1中所述的“采集樣本數(shù)據(jù),并按標(biāo)簽進(jìn)行分類”,其做法如下:首先在社交網(wǎng)絡(luò)上采集用于學(xué)習(xí)訓(xùn)練的樣本數(shù)據(jù),需要采集的信息包括消息內(nèi)容、創(chuàng)建者標(biāo)識(shí)序號、創(chuàng)建時(shí)間、轉(zhuǎn)發(fā)者標(biāo)識(shí)序號、轉(zhuǎn)發(fā)時(shí)間以及類型標(biāo)簽,將數(shù)據(jù)按類型標(biāo)簽劃分為事實(shí)和謠言兩個(gè)類別。
3.根據(jù)權(quán)利要求1所述的一種基于樸素貝葉斯模型的謠言識(shí)別方法,其特征在于:
在步驟1.2中所述的“定義網(wǎng)絡(luò)節(jié)點(diǎn)與連邊形式,構(gòu)建消息轉(zhuǎn)發(fā)網(wǎng)絡(luò)”,其做法如下:在步驟1.1采集的樣本數(shù)據(jù)基礎(chǔ)上,將網(wǎng)絡(luò)節(jié)點(diǎn)定義為參與消息轉(zhuǎn)發(fā)的用戶,將連邊定義為消息的轉(zhuǎn)發(fā)關(guān)系,方向?yàn)閺谋晦D(zhuǎn)發(fā)用戶節(jié)點(diǎn)指向轉(zhuǎn)發(fā)用戶節(jié)點(diǎn);因此,按照上述節(jié)點(diǎn)和連邊的定義,并依據(jù)步驟1.1采集的樣本數(shù)據(jù),按照事實(shí)和謠言標(biāo)簽分別構(gòu)建謠言和事實(shí)轉(zhuǎn)發(fā)網(wǎng)絡(luò)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京航空航天大學(xué),未經(jīng)北京航空航天大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811200240.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于信息增益率的屬性加權(quán)方法及文本分類方法
- 一種基于決策樹的屬性加權(quán)方法及文本分類方法
- 一種基于主動(dòng)學(xué)習(xí)的化工過程故障監(jiān)控方法
- 一種改進(jìn)的選擇性樸素貝葉斯方法
- 基于改進(jìn)深度特征加權(quán)的樸素貝葉斯文本分類方法
- 一種基于改進(jìn)樸素貝葉斯的涉密文本識(shí)別方法
- 一種基于特異性的詞頻加權(quán)方法及文本分類方法
- 基于樸素貝葉斯機(jī)器學(xué)習(xí)模型預(yù)測存儲(chǔ)設(shè)備性能方法系統(tǒng)
- 基于樸素貝葉斯的電纜老化狀態(tài)評估方法和裝置
- 一種以樸素貝葉斯模型和云端安全的大數(shù)據(jù)入侵檢測方法
- 一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法
- 構(gòu)建解決組合爆炸問題的級聯(lián)貝葉斯網(wǎng)絡(luò)的方法
- 一種可重構(gòu)系統(tǒng)貝葉斯網(wǎng)構(gòu)建方法
- 一種基于貝葉斯網(wǎng)絡(luò)的網(wǎng)站缺陷預(yù)測方法及其實(shí)現(xiàn)系統(tǒng)
- 應(yīng)用處理方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種遮擋目標(biāo)檢測方法、電子設(shè)備、存儲(chǔ)介質(zhì)及系統(tǒng)
- 基于貝葉斯網(wǎng)絡(luò)推理模型的犯罪重建方法及裝置
- 利用憶阻器本征噪聲實(shí)現(xiàn)貝葉斯神經(jīng)網(wǎng)絡(luò)的方法及裝置
- 基于面向?qū)ο筘惾~斯網(wǎng)絡(luò)的中央空調(diào)系統(tǒng)故障診斷方法
- 一種基于貝葉斯神經(jīng)網(wǎng)絡(luò)權(quán)重約束的圖像分類方法





