[發(fā)明專利]一種網(wǎng)頁作弊用戶、作弊網(wǎng)頁的識別方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210044171.5 | 申請日: | 2012-02-24 |
| 公開(公告)號: | CN103294686B | 公開(公告)日: | 2018-04-17 |
| 發(fā)明(設(shè)計)人: | 楊娜;廖宇奇;許春林;邵榮防 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京派特恩知識產(chǎn)權(quán)代理有限公司11270 | 代理人: | 張穎玲,蔣雅潔 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)頁 作弊 用戶 識別 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)頁作弊用戶、作弊網(wǎng)頁的識別方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用戶可以隨時隨地通過互聯(lián)網(wǎng)了解自己感興趣的信息,并可以隨時通過互聯(lián)網(wǎng)上傳文件或發(fā)表意見,由此,論壇、博客、微博以及社區(qū)(網(wǎng)絡(luò)板塊)也已成為人們生活中重要的一個組成部分。尤其是針對熱門話題,例如,人民群眾最關(guān)心、最直接、最現(xiàn)實的教育、社保、醫(yī)療、樓市、股市、勞動就業(yè)問題等,通常會通過互聯(lián)網(wǎng)的傳播而引起公眾強烈關(guān)注,然而,有些作弊用戶以增加網(wǎng)站的曝光度或推廣商品或網(wǎng)站為目的,頻繁發(fā)表和熱門話題相關(guān)的內(nèi)容、增加特定關(guān)鍵字的曝光率,在這種情況下,如何保證互聯(lián)網(wǎng)信息的準確、安全、有效就愈發(fā)重要。反作弊對于維護網(wǎng)絡(luò)社區(qū)環(huán)境、保證信息的傳遞有著很重要的作用。
傳統(tǒng)的反作弊方法通常是基于網(wǎng)頁鏈接分析和檢測隱藏技術(shù),通過分析網(wǎng)頁的錨文本內(nèi)容、錨文本鏈接、隱藏文本的內(nèi)容等信息,把這些信息作為某個網(wǎng)頁的作弊表征,計算這些信息和某個網(wǎng)頁作弊的關(guān)聯(lián)強度,關(guān)聯(lián)強度高的即為作弊網(wǎng)頁。
然而,由于社區(qū)數(shù)據(jù)中錨文本鏈接普遍較少,按照現(xiàn)有技術(shù)利用網(wǎng)頁的鏈接及隱藏內(nèi)容難以有效的進行作弊識別。
因此,亟需一種網(wǎng)頁作弊用戶、作弊網(wǎng)頁的識別方案用以解決上述問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種網(wǎng)頁作弊用戶、作弊網(wǎng)頁的識別方法及系統(tǒng),用以解決社區(qū)數(shù)據(jù)鏈接少帶來的作弊識別困難的問題。
為此,本發(fā)明實施例采用如下技術(shù)方案:
本發(fā)明實施例提供一種網(wǎng)頁作弊用戶識別方法,包括以下步驟:
根據(jù)熱詞集合內(nèi)的熱詞進行網(wǎng)頁檢索,得到各熱詞對應(yīng)的網(wǎng)頁集合;
根據(jù)各網(wǎng)頁集合,得到各熱詞對應(yīng)的作者集合;
統(tǒng)計各作者在各作者集合內(nèi)的出現(xiàn)次數(shù);
根據(jù)各作者的在各作者集合內(nèi)的出現(xiàn)次數(shù),識別網(wǎng)頁作弊用戶。
本發(fā)明又一實施例提供一種作弊網(wǎng)頁識別方法,包括以下步驟:
根據(jù)熱詞集合內(nèi)的熱詞進行網(wǎng)頁檢索,得到各熱詞對應(yīng)的網(wǎng)頁集合;
統(tǒng)計所述網(wǎng)頁集合內(nèi)的網(wǎng)頁被所述熱詞命中的次數(shù);
根據(jù)所述網(wǎng)頁集合內(nèi)的網(wǎng)頁被所述熱詞命中的次數(shù),識別作弊網(wǎng)頁。
本發(fā)明又一實施例提供一種網(wǎng)頁作弊用戶識別系統(tǒng),包括:檢索模塊和識別模塊,所述識別模塊包括作者集合確定單元、統(tǒng)計單元和識別單元;
所述檢索模塊,用于根據(jù)熱詞集合內(nèi)的熱詞進行網(wǎng)頁檢索,得到各熱詞對應(yīng)的網(wǎng)頁集合;
所述作者集合確定單元,用于根據(jù)各網(wǎng)頁集合,得到各熱詞對應(yīng)的作者集合;
所述統(tǒng)計單元,用于統(tǒng)計各作者在各作者集合內(nèi)的出現(xiàn)次數(shù);
所述識別單元,用于根據(jù)各作者的在各作者集合內(nèi)的出現(xiàn)次數(shù),識別網(wǎng)頁作弊用戶。
本發(fā)明又一實施例提供一種作弊網(wǎng)頁識別系統(tǒng),包括:檢索模塊和識別模塊,識別模塊包括統(tǒng)計單元和識別單元;
所述檢索模塊,用于根據(jù)熱詞集合內(nèi)的熱詞進行網(wǎng)頁檢索,得到各熱詞對應(yīng)的網(wǎng)頁集合;
所述統(tǒng)計單元,用于統(tǒng)計所述網(wǎng)頁集合內(nèi)的網(wǎng)頁被所述熱詞命中的次數(shù);
所述識別單元,用于根據(jù)所述網(wǎng)頁集合內(nèi)的網(wǎng)頁被所述熱詞命中的次數(shù),識別作弊網(wǎng)頁。
與現(xiàn)有技術(shù)相比,本發(fā)明的實施例具有如下優(yōu)點:
本發(fā)明實施例通過檢索熱詞集合內(nèi)的熱詞,得到命中熱詞的網(wǎng)頁集合及其對應(yīng)的作者集合,通過計算各作者被熱詞命中的次數(shù)識別網(wǎng)頁作弊用戶,使得作弊用戶創(chuàng)建作弊數(shù)據(jù)的代價增加,可以有效防止作弊行為的發(fā)生。此外,本發(fā)明實施例通過以熱詞集合內(nèi)的熱詞進行檢索,統(tǒng)計網(wǎng)頁被熱詞集合內(nèi)的熱詞命中的次數(shù),識別作弊網(wǎng)頁,在網(wǎng)頁錨文本鏈接較少的情況下,解決社區(qū)數(shù)據(jù)鏈接少帶來的作弊識別困難的問題。
附圖說明
圖1為本發(fā)明實施例一提供的在統(tǒng)計分析階段,依據(jù)多次檢索結(jié)果進行統(tǒng)計分析,識別網(wǎng)頁作弊用戶的流程示意圖;
圖2為本發(fā)明實施例一提供的在統(tǒng)計分析階段,依據(jù)一次檢索結(jié)果進行統(tǒng)計分析,識別網(wǎng)頁作弊用戶的流程示意圖;
圖3為本發(fā)明實施例二提供的識別作弊網(wǎng)頁的流程示意圖;
圖4為本發(fā)明實施例三提供的網(wǎng)頁作弊用戶識別系統(tǒng)的結(jié)構(gòu)示意圖;
圖5為本發(fā)明實施例四提供的作弊網(wǎng)頁識別系統(tǒng)的結(jié)構(gòu)示意圖。
具體實施方式
熱詞即熱門詞匯,熱詞反映了一個國家、一個地區(qū)在一個時期人們普遍關(guān)注的問題和事物,反映一個時期的熱點話題及民生等問題。熱詞集合是由多個熱詞構(gòu)成的集合,熱詞集合可以由用戶進行定義。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210044171.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:螺線管裝置
- 下一篇:AO2處理高氨氮工業(yè)廢水的方法





