[發明專利]一種檢測網頁惡意篡改的方法和裝置在審
| 申請號: | 201711220764.1 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN107835191A | 公開(公告)日: | 2018-03-23 |
| 發明(設計)人: | 方楊森;王彥杰 | 申請(專利權)人: | 中科信息安全共性技術國家工程研究中心有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 檢測 網頁 惡意 篡改 方法 裝置 | ||
技術領域
本發明涉及網頁安全領域,具體而言,涉及一種檢測網頁惡意篡改的方法。
背景技術
網頁篡改是一種常見的網絡攻擊行為。攻擊者在攻擊網站后,往往會修改現有的網頁,向現有的頁面中寫入惡意代碼或垃圾信息等。被篡改的網頁不僅影響了網站的正常運行,還向瀏覽網頁的用戶傳播了惡意代碼和非法信息等,危害十分嚴重。
目前常用的檢測網頁篡改的方法為網頁指紋比對法。該方法通過散列函數預先計算網站下每個網頁的數字指紋,收集數字指紋建立指紋庫,相隔一定時間后再重新計算每個網頁的指紋,并與指紋庫中的指紋進行比對。若同一網頁的數字指紋不同則說明該網頁被篡改。然而這種方法需要在網站未被篡改前建立指紋庫,且每次新建或修改網頁時也必須更新指紋庫,操作繁瑣且效率低下。
發明內容
本發明是針對現有技術的不足,提出了一種檢測網頁惡意篡改的方法,該方法的應用可以有效快速的檢測網頁是否被修改,具有較高的安全性。
一種檢測網頁篡改的方法,包括:
對網站的根目錄進行掃描,采用相似哈希算法計算每個網頁的哈希值,并收集生成的哈希值建立基礎哈希庫;
監測網站目錄的寫入操作,針對被修改的頁面,使用相似哈希算法重新計算被修改頁面的哈希值,并從基礎哈希庫中提取出相應文件的哈希值;
對比前后兩次生成的哈希值,若比對結果的相似度小于一個閾值,則可視為該網頁被修改;
對被修改的網頁進行特征檢測,并判斷網頁是否被惡意篡改。
所述的相似哈希算法為:相似哈希算法同其他哈希算法一致,區別是相似哈希算法對于指定對象生成唯一且定長的哈希值;對于兩個對象,若兩個對象越相似,則生成的哈希值相差越小。
同時,本發明還提出了一種檢測網頁篡改的裝置,該裝置包括網頁爬取單元、計算單元和檢測單元;
所述網頁爬取單元,用于遍歷站點目錄,獲取站點下的所有網頁,同時監測站點目錄的寫入操作,記錄被修改的網頁;
所述計算單元,利用相似哈希算法計算網頁爬取單元獲取的網頁的哈希值并存儲至基礎哈希庫中;同時對于網頁爬取單元監測到的被修改的網頁,重新計算被修改網頁的哈希值,并與基礎哈希庫中的相應哈希值進行比對,計算修改前后網頁的相似度;
所述檢測單元,獲取計算單元中計算出相似度小于設定閾值的被修改的網頁,采用特征檢測法檢測被修改的網頁是否含有惡意代碼或有害信息。
進一步的,所述網頁爬取單元可在爬取網頁時去除網頁包含的HTML標簽,以獲得網頁的文本內容。
本發明所述技術方案的有益效果在于:本發明所提出的檢測法采用相似哈希算法計算網頁的相似度,以此判斷網頁是否被篡改。與已有的網頁指紋比對法相比,本發明所提出的檢測法不需要定期計算站點目錄下網頁的指紋,且能在站點發生修改操作時實時進行檢測,簡化了操作步驟,提高了檢測網頁篡改的效率。
具體實施方式
為了使本領域技術人員更好地理解本發明的技術方案,下面結合具體實施例對本發明作進一步的詳細說明。
一種檢測網頁篡改的方法,包括:
對網站的根目錄進行掃描,采用相似哈希算法計算每個網頁的哈希值,并收集生成的哈希值建立基礎哈希庫;
監測網站目錄的寫入操作,針對被修改的頁面,使用相似哈希算法重新計算被修改頁面的哈希值,并從基礎哈希庫中提取出相應文件的哈希值;
對比前后兩次生成的哈希值,若比對結果的相似度小于一個閾值,則可視為該網頁被修改;
對被修改的網頁進行特征檢測,并判斷網頁是否被惡意篡改。
所述的相似哈希算法為:相似哈希算法同其他哈希算法一致,區別是相似哈希算法對于指定對象生成唯一且定長的哈希值;對于兩個對象,若兩個對象越相似,則生成的哈希值相差越小。因此,該算法可以用于快速比對兩個對象的相似度。
同時,本發明還提出了一種檢測網頁篡改的裝置,該裝置包括網頁爬取單元、計算單元和檢測單元;
所述網頁爬取單元,用于遍歷站點目錄,獲取站點下的所有網頁,同時監測站點目錄的寫入操作,記錄被修改的網頁;
所述計算單元,利用相似哈希算法計算網頁爬取單元獲取的網頁的哈希值并存儲至基礎哈希庫中;同時對于網頁爬取單元監測到的被修改的網頁,重新計算被修改網頁的哈希值,并與基礎哈希庫中的相應哈希值進行比對,計算修改前后網頁的相似度;
所述檢測單元,獲取計算單元中計算出相似度小于設定閾值的被修改的網頁,采用特征檢測法檢測被修改的網頁是否含有惡意代碼或有害信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科信息安全共性技術國家工程研究中心有限公司,未經中科信息安全共性技術國家工程研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711220764.1/2.html,轉載請聲明來源鉆瓜專利網。





