[發明專利]惡意論壇的識別方法及裝置在審
申請號: | 201310368712.4 | 申請日: | 2013-08-22 |
公開(公告)號: | CN103475642A | 公開(公告)日: | 2013-12-25 |
發明(設計)人: | 朱珊珊;林英杰 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F17/30 |
代理公司: | 北京智匯東方知識產權代理事務所(普通合伙) 11391 | 代理人: | 康正德;薛峰 |
地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 惡意 論壇 識別 方法 裝置 | ||
技術領域
本發明涉及互聯網領域,特別是涉及一種惡意論壇的識別方法及裝置。
背景技術
惡意論壇是指故意在計算機系統上執行惡意任務的病毒、蠕蟲和特洛伊木馬等的非法論壇。這類論壇通常都有一個共同特點,他們通常情況下是以某種頁面形式讓人們正常瀏覽頁面內容,同時非法獲取用戶計算機中的各種數據。現如今,惡意論壇嚴重地影響用戶的網絡環境,所以,對惡意論壇的識別也已經成為保證網絡安全的重要工作之一,目前,通常采用如下兩種技術對惡意論壇進行識別。
第一種,在防火墻的內存中存儲有惡意論壇的IP(Internet?Protocol,網絡之間互連的協議)地址以及符合該IP地址的所有URL(Uniform?Resource?Locator,統一資源定位符)的對應關系。當獲取到用戶訪問某論壇的URL請求時,還要獲取該論壇的IP地址,根據該論壇的IP地址在防火墻內存中查找該IP地址對應的所有URL,并將論壇URL與防火墻內存中該IP地址對應的所有URL進行對比,對比成功則說明該論壇為惡意論壇。
第二種,將用戶想要訪問的論壇的URL與惡意關鍵詞列表頁匹配,在匹配結果中選取基準關鍵字,并對這組關鍵字進行順序標號標識,若該組關鍵字的順序號標識數目與保存的惡意關鍵詞表中的該組關鍵字的順序號標識數目一致,則說明該論壇為惡意論壇。
上述兩種技術均為基于URL對比的方式,這就需要預先獲取到惡意論壇的URL并存儲,因此僅能夠對已知的惡意論壇進行識別和過濾,對未知的惡意論壇無法進行識別和處理。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的惡意論壇的識別方法及裝置。
本發明提供了一種惡意論壇的識別方法,包括:
獲取待訪問論壇的論壇名稱和論壇的版塊名稱;
將論壇名稱和版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配;
若匹配成功,則識別論壇為惡意論壇。
進一步地,在識別論壇為惡意論壇之后,還包括:
收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,得到論壇名稱列表和版塊名稱列表;
對論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,將新惡意關鍵詞添加到關鍵詞庫中。
進一步地,對論壇名稱列表和版塊名稱列表進行熱點聚合,得到新惡意關鍵詞,包括:
根據最長公共子序列LCS算法,生成與論壇名稱列表和版塊名稱列表各自對應的熱點詞表;
根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞;
將獲取的各個熱點關鍵詞進行合并,作為新惡意關鍵詞。
進一步地,各個熱點詞表的生成方式包括:
對于論壇名稱列表和版塊名稱列表而言,
采用最長公共子序列LCS算法對其中包含的每兩個詞進行匹配;
獲取每兩個詞之間的最長公共子序列,作為熱點關鍵詞;
將獲取的所有熱點關鍵詞進行組合,得到與其對應的熱點詞表。
進一步地,根據詞語出現頻率在各個熱點詞表中選擇熱點關鍵詞,包括:
根據預設規則分別對各個熱點詞表中的熱點關鍵詞進行篩選;
在篩選后的各個熱點詞表中選擇出現頻率由高到低的預設個數熱點關鍵詞。
進一步地,根據預設規則分別對各個熱點詞表中的熱點關鍵詞進行篩選,包括:
對各個熱點詞表進行常用語去除處理,其中,常用語為使用頻率超過預設次數的詞語;
判斷處理后的各個熱點詞表中的熱點關鍵詞所對應的論壇是否為惡意論壇;
若是,保留該關鍵詞;
若否,去除該關鍵詞。
進一步地,收集所有已知惡意論壇的論壇名稱和版塊名稱并進行處理,包括:
收集所有已知惡意論壇的論壇名稱和版塊名稱并存入各自對應的預處理庫;
對各個預處理庫中、來自同一網絡之間互連協議IP地址的名稱進行消重處理。
進一步地,對論壇名稱列表和版塊名稱列表進行熱點聚合,包括:
每隔預設時間對論壇名稱列表和版塊名稱列表進行熱點聚合。
進一步地,惡意關鍵詞包括論壇名稱關鍵詞和版塊名稱關鍵詞;
將論壇名稱以及版塊名稱分別與預存關鍵詞庫中的惡意關鍵詞進行匹配,包括:
將論壇名稱與論壇名稱關鍵詞匹配,將版塊名稱與版塊名稱關鍵詞匹配;
當論壇名稱與論壇名稱關鍵詞匹配,且版塊名稱與版塊名稱關鍵詞匹配時,則確認匹配成功;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310368712.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:惡意程序檢測方法
- 下一篇:一種用于發送消息的方法及裝置