[發(fā)明專利]一種檢測網(wǎng)絡(luò)水軍以及找到網(wǎng)絡(luò)水軍的方法有效
| 申請?zhí)枺?/td> | 201110418586.X | 申請日: | 2011-12-14 |
| 公開(公告)號: | CN102571484A | 公開(公告)日: | 2012-07-11 |
| 發(fā)明(設(shè)計)人: | 周異;申沛;陳凱;宋利;楊小康 | 申請(專利權(quán))人: | 上海交通大學(xué) |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L29/08 |
| 代理公司: | 上海漢聲知識產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 檢測 網(wǎng)絡(luò) 水軍 以及 找到 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種社交網(wǎng)絡(luò),具體地說,涉及的是一種檢測網(wǎng)絡(luò)水軍以及找到網(wǎng)絡(luò)水軍的方法。
背景技術(shù)
如今社會,網(wǎng)絡(luò)已經(jīng)成為人們信息傳播和資源共享的重要途徑,對社會的生產(chǎn)活動產(chǎn)生了很大的影響。人們通過網(wǎng)絡(luò)獲取信息的方式更為快捷、經(jīng)濟和開放,大大方便了人們?nèi)粘9ぷ骱蜕睿?jié)約了成本。同時,網(wǎng)絡(luò)也已經(jīng)發(fā)展為一種虛擬的社會形態(tài)。
社交網(wǎng)絡(luò),主要類似微博,是一個基于用戶關(guān)系的信息分享、傳播以及獲取的平臺。在科技發(fā)達的今天,人們可以隨時隨地的看微博,發(fā)微博,獲取最新的信息。但是信息的真實性,卻并不像想象中那么高。
水軍,是指在網(wǎng)絡(luò)中大量灌水的人員。在樓主發(fā)微博之后,為了獲得最廣大網(wǎng)名的注意,就需要大量的人員來回復(fù)或者轉(zhuǎn)發(fā)其微博。而這個工作常常需要成百上千的人來共同完成,于是經(jīng)常會利用水軍來完成這個任務(wù)。一旦大規(guī)模的水軍在網(wǎng)絡(luò)中發(fā)帖造勢,很容易控制輿論導(dǎo)向,使得虛假信息到處傳播,危害社會穩(wěn)定。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是提供一種檢測網(wǎng)絡(luò)中存在的水軍的方法,并基于此,找出這些水軍,以便于發(fā)現(xiàn)并控制虛假信息的傳播,從而可以盡量維護網(wǎng)絡(luò)社會的真實和穩(wěn)定性。
本發(fā)明一個目的是提供一種檢測網(wǎng)絡(luò)水軍的方法,具體包括:
第一步,帳號特征模塊對帳號特征向量進行描述,這個向量包括多維;
第二步,帳號檢測模塊對收集的帳號,根據(jù)帳號特征向量符合機器人帳號特性的多少來檢測網(wǎng)絡(luò)水軍。
上述步驟中,用R表示機器人特征顯著性,帳號的特征描述向量有多個維度,第i個維度有一個權(quán)值a[i],被判斷滿足該維度條件的帳號會獲得a[i]的權(quán)值加成,即R=R+a[i],當(dāng)最終權(quán)值R>Rmax,則該帳號為機器人帳號。a[i]與Rmax的值將在下面給出。
進一步的,所述帳號特征模塊,其中帳號特征描述向量維度包括:
向量維度1:帳號的關(guān)注人數(shù)是否異常;
向量維度2:關(guān)注人數(shù)與粉絲數(shù)的比值是否異常;
向量維度3:帳號所發(fā)原創(chuàng)微博的文字內(nèi)容是否為抄襲所得;
向量維度4:帳號所發(fā)圖片內(nèi)容是否為抄襲所得;
向量維度5:帳號轉(zhuǎn)發(fā)微博是否不帶評論;
向量維度6:帳號是否發(fā)廣告和垃圾信息;
向量維度7:帳號所發(fā)評論是否為抄襲;
向量維度8:帳號發(fā)帖內(nèi)容的是否相似度高;
向量維度9:帳號發(fā)帖頻率是否異常。
向量維度10:帳號發(fā)帖間隔是否異常。
進一步的,所述帳號檢測模塊檢測網(wǎng)絡(luò)水軍,具體流程如下:
1)向量維度1:帳號的關(guān)注人數(shù)異常。如果關(guān)注人數(shù)Nforward>FMAX,F(xiàn)MAX=300。則判斷滿足機器人特征,R=R+a[1],a[1]=5;
2)向量維度2:關(guān)注人數(shù)與粉絲數(shù)的比值異常。如果關(guān)注人數(shù)與粉絲數(shù)的比值K>Kmax=5,或者K<Kmin=0.2。則判斷滿足機器人特征,R=R+a[2],a[2]=3;
3)向量維度3:帳號所發(fā)原創(chuàng)微博的文字內(nèi)容為抄襲所得。從帳號微博中選一句話出來進行搜索,把所有搜索出來的原創(chuàng)微博進行一種聚類。每一類中微博發(fā)布時間Wtime最小的微博可以認為是原創(chuàng)微博,而對于其余微博,如果相似度L>Lmax,則認為是抄襲微博。獲得除本帳號以外所有被認為抄襲了微博的帳號ID,轉(zhuǎn)到1)步。Lmax=90%。如果該帳號微博相似度L>Lmax,,則判斷滿足機器人特征,R=R+a[3],a[3]=4;
4)向量維度4:帳號所發(fā)圖片內(nèi)容為抄襲所得。通過圖像處理技術(shù)判斷圖片中如果否有他人logo或者相互重疊的logo,則判斷滿足機器人特征,R=R+a[4],a[4]=4;
5)向量維度5:帳號轉(zhuǎn)發(fā)微博不帶評論。不加評論的概率超過P>Pmax=95%,則判斷滿足機器人特征,R=R+a[5],a[5]=2;
6)向量維度6:帳號發(fā)廣告和垃圾信息。可以通過語義識別判斷出帳號的評論是否為廣告。對于有鏈接的回復(fù)可以獲取其網(wǎng)址,打開網(wǎng)址。通過一定方法判斷該回復(fù)是不是在為這個網(wǎng)站打廣告。如果判斷成功,則判斷滿足機器人特征,R=R+a[6],a[6]=10;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海交通大學(xué),未經(jīng)上海交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110418586.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 一種網(wǎng)絡(luò)水軍的探測與判定方法
- 一種在微博平臺中捕獲水軍的方法
- 微博水軍識別方法與設(shè)備
- 一種基于粒子群算法的網(wǎng)絡(luò)水軍賬號識別方法及系統(tǒng)
- 基于虛假交易和社交關(guān)系矩陣分析的水軍身份確認方法
- 識別網(wǎng)絡(luò)水軍團體的方法及系統(tǒng)
- 一種基于網(wǎng)絡(luò)點贊檢測網(wǎng)絡(luò)水軍的方法
- 網(wǎng)絡(luò)水軍的識別方法及裝置、存儲介質(zhì)和處理器
- 一種網(wǎng)絡(luò)水軍的檢測方法及裝置
- 汽車主機廠網(wǎng)絡(luò)數(shù)據(jù)的水軍識別方法及裝置





