[發明專利]頁面篡改檢測方法及黑鏈數據庫生成方法有效
| 申請號: | 201410318946.2 | 申請日: | 2011-12-30 |
| 公開(公告)號: | CN104063494B | 公開(公告)日: | 2017-11-14 |
| 發明(設計)人: | 劉起;郭峰 | 申請(專利權)人: | 北京奇虎科技有限公司;奇智軟件(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 趙娟 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 頁面 篡改 檢測 方法 數據庫 生成 | ||
本發明專利申請是申請日為2011年12月30日、申請號為201110457654.3、名稱為“一種檢測頁面篡改的方法及裝置”的中國發明專利申請的分案申請。
技術領域
本申請涉及計算機安全的技術領域,特別是涉及一種檢測頁面篡改的方法,以及一種檢測頁面篡改的裝置。
背景技術
萬維網成為大量信息的載體,為有效地提取并利用這些信息,搜索引擎(Search Engine)作為一個輔助人們檢索信息的工具,成為用戶訪問萬維網的入口和指南。
SEO(Search Engine Optimization,搜索引擎優化),是較為流行的網絡營銷方式,主要目的是增加特定關鍵字的曝光率以增加網站的能見度,使其提高搜索引擎排名,從而提高網站訪問量,最終提升網站的銷售能力或宣傳能力。網站SEO數據表示本網站的內容在其它搜索引擎中被收錄的數量,收錄得越多就更容易被用戶搜索到。
對于搜索引擎的這種特性,目前有些工具提供了黑鏈技術,黑鏈是SEO黑帽手法中相當普遍的一種手段,籠統地說,它就是指一些人用非正常的手段獲取的其它網站的反向鏈接,最常見的黑鏈就是通過各種網站程序漏洞獲取搜索引擎權重或者PR(PageRank,網頁級別),較高的網站的WEBSHELL(匿名用戶(入侵者)通過網站端口對網站服務器的某種程度上操作的權限),進而在被黑網站上鏈接自己的網站。
黑鏈主要針對搜索引擎,例如,對搜索引擎搜索出來的排名最靠前的幾個網站進行簡單的分析,查看其網站架構,關鍵詞分布,以及外鏈等等,有可能發現一些網站排名非常好,而且關鍵詞網頁相關數都達到幾百萬,但網站架構一般,關鍵詞密度不是很合適,最主要的是有些網站沒有任何導出的鏈接,通過查看其反向鏈接才發現,絕大數外鏈都來自于黑鏈。SEO主要是靠高質量的外鏈來決定排名,按照百分比來講,應超過50%,因此在權重較高的網站上做黑鏈有利于網站排名的。此外黑鏈一般以隱藏鏈接的模式,所以在網站的常規檢查中管理員很難發現網站被做了黑鏈。目前,黑鏈一般用于暴利的黑(灰)色產業,例如私服,醫療,冷門高利潤行業等等。黑鏈也已形成產業化。在實際應用中,如果用戶沒有做好安全防護工作,那么打開被黑鏈篡改的頁面就會容易就會感染網站上的病毒。
現有技術中,對于黑鏈的檢測通常是由人工,比如網站的站長,通過大量人工收集的篡改關鍵詞,如hack、hacked by,六合彩、性經歷、外掛,私服等匹配網頁中的HTML正文,以判斷其是否被黑鏈篡改。例如,被黑鏈篡改網頁常見的特征分為黑客炫耀的特征如:然而,這種人工檢測的方式嚴重依賴于人工收集的篡改關鍵詞和人工的定期檢測,效率十分低下。
再者,對于在所需檢測頁面數量眾多,并且,所需匹配的黑鏈特征數據(如篡改關鍵詞)較多的情況下,人工的方式顯然完全無法應對。
因此,目前需要本領域技術人員解決的一個技術問題就是,提供一種檢測頁面篡改的機制,用以在盡可能減少人工干預的前提下,提高檢測頁面篡改的效率和準確率,尤其是在需檢測頁面數量眾多,并且,所需匹配的黑鏈特征數據較多的情況下,提高檢測頁面篡改的效率和準確率。
發明內容
本申請提供一種檢測頁面篡改的方法,用以在盡可能減少人工干預的前提下,提高檢測頁面篡改的效率和準確率,尤其是在需檢測頁面數量眾多,并且,所需匹配的黑鏈特征數據較多的情況下,提高檢測頁面篡改的效率和準確率。
本申請還提供了一種檢測頁面篡改的裝置,用以保證上述方法在實際中的應用及實現。
為了解決上述問題,本申請公開了一種檢測頁面篡改的方法,包括:
生成黑鏈特征數據庫,并在多臺服務器中部署所述黑鏈特征數據庫,所述黑鏈特征數據庫中包括黑鏈特征數據;
獲取當前檢測頁面的特征信息;
依據所述頁面的特征信息確定對應的目標服務器;
采用所述目標服務器中的黑鏈特征數據庫與當前檢測頁面進行匹配,判斷當前檢測頁面中是否包含所述黑鏈特征數據庫中的黑鏈特征數據,若是,則判定當前頁面為被篡改頁面。
優選的,所述服務器具有服務器標識,所述特征信息包括頁面分類信息,所述依據頁面的特征信息確定對應的目標服務器的步驟包括:
按照預置的頁面分類信息與服務器標識的對應關系,提取當前頁面分類信息對應的服務器標識;
將所述服務器標識對應的服務器確定為目標服務器。
優選的,所述特征信息包括頁面的URL,所述服務器具有數值標識,所述依據頁面的特征信息確定對應的服務器標識的步驟包括:
采用預設算法將當前檢測頁面的URL轉換為數值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司;奇智軟件(北京)有限公司,未經北京奇虎科技有限公司;奇智軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410318946.2/2.html,轉載請聲明來源鉆瓜專利網。





