[發明專利]一種基于網頁模板匹配的web漏洞掃描方法有效
| 申請號: | 201310374770.8 | 申請日: | 2013-08-25 |
| 公開(公告)號: | CN103428219A | 公開(公告)日: | 2013-12-04 |
| 發明(設計)人: | 池水明;周蘇杭;陳勤;孫斌;張旻;方曉波 | 申請(專利權)人: | 金華比奇網絡技術有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 周烽 |
| 地址: | 321017 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網頁 模板 匹配 web 漏洞 掃描 方法 | ||
技術領域
本發明涉及信息安全和網頁架構領域,尤其涉及一種基于網頁模板匹配的web漏洞掃描方法。
背景技術
Web應用程序面向廣大Web用戶,一旦出現嚴重漏洞,其危害將非常大。Web應用程序存在許多種漏洞,導致易受到攻擊,其中,SQL?注入攻擊(SQL?injection)是目前主流的Web攻擊方法之一。SQL?注入攻擊者利用Web?應用程序沒有對用戶輸入數據的合法性進行判斷,通過Web頁面的輸入區域(如URL、表單等),用精心構造的?SQL?語句插入特殊字符和指令,從而對后端數據庫進行攻擊,以獲得管理員權限。
SQL?注入漏洞檢測的基本原理是采用模擬攻擊方式,構造特殊的SQL?語句對目標?Web?站點的URL?地址進行注入測試,然后根據返回的網頁內容確定是否存在注入漏洞。例如,若在URL?地址后附加SQL?語句“and?1=1”測試語句執行后返回正常網頁,而附加“”或“and?1=2”測試語句執行后返回包含數據庫錯誤信息的網頁或者其他與正常時相異的網頁,則判定該?Web?頁面存在?SQL?注入漏洞。所謂“注入點”就是可以實行注入的地方,通常是一個訪問數據庫的連接。SQL注入漏洞掃描的過程可描述為:1、利用網絡爬蟲抓取網站網頁;2、分析網頁頁面結構,尋找可能的注入點;3、向注入點發送模擬攻擊數據;4、通過分析返回數據判斷被檢測的網頁是否存在SQL注入漏洞。在對Web漏洞掃描過程中需要抓取網站所有網頁,再進行分析、測試,這種方式雖然可以獲得較高的掃描準確率,但對大型網站,將導致過高的掃描時間。
因此,在保證漏洞掃描的準確率的情況下,實現適當縮減掃描規模,以提高SQL注入漏洞掃描效率成為了當前亟需解決的問題。
發明內容
為了提高SQL注入漏洞掃描效率,本發明提供了一種基于網頁模板匹配的web漏洞掃描方法。
本發明的目的是通過以下技術方案來實現的:一種基于網頁模板匹配的web漏洞掃描方法,包括以下步驟:
(1)維護一個掃描網站的目錄樹,目錄樹的每個節點均為一個目錄;
(2)利用網絡爬蟲抓取網頁,根據網頁的URL地址將網頁放到相應的目錄節點;
(3)當從一個目錄節點中隨機抽取的網頁數量達到指定值時,對該目錄中的網頁進行模板匹配分別記錄該目錄下網頁的相似值和不相似值;
(4)模板匹配過程中維護兩個隊列,其中待分析隊列保存目錄中尚未處理的網頁,模板隊列保存匹配成功的網頁。初始時,目錄中一個網頁保存到模板隊列,其他網頁都保存到待分析隊列;
(5)待分析隊列出隊一個待分析網頁,若待分析隊列為空則轉步驟(9);
(6)遍歷模板隊列,分別計算待分析網頁與模板隊列中網頁的相似度;
(7)若相似度超過閾值則繼續遍歷模板隊列,否則轉步驟(5);
(8)若步驟(7)中模板隊列遍歷結束,且相似度均大于閾值則網頁進入模板隊列;
(9)計算目錄中網頁匹配成功的概率,即模板隊列中網頁數與目錄下網頁數的百分比。匹配成功的概率大于一定閾值,則不再繼續爬行該目錄下其他網頁,否則需要繼續爬行該目錄下其他網頁。
(10)對目錄樹中所爬取的所有網頁進行SQL注入測試;
(11)掃描結束。
本發明的有益效果是,本發明利用網頁模板匹配技術實現了一種高效的web漏洞掃描方法,而不再依賴對整個網站所有網頁抓取和掃描。該方法通過計算檢測到頁面與模板頁面的結構相似度,判斷該頁面是否需要抓取并進行漏洞掃描;本發明對設備要求簡單,漏洞檢測準確率高,同時在應用中表現出良好的穩定性。
附圖說明
圖1是基于網頁模板匹配的漏洞掃描的流程圖。
具體實施方式
本發明提供一種基于網絡模板匹配的、高效的漏洞掃描解決方案。該方案在網頁爬取過程中維護一個掃描網站的目錄樹,目錄樹的每一個節點均為一個目錄,目錄中可以包含子目錄及該目錄中的網頁。漏洞掃描當爬取到一個網頁時,根據網頁的URL地址將網頁存放到相應的目錄節點中,當一個目錄節點中的網頁數量達到指定值時,對該目錄中的網頁進行模板匹配,計算出網頁的相似度,如果相似度達到一定閾值,則可判斷該目錄中的網頁由同一模板生成,該目錄中的其他網頁無需再爬取。最后,方案將對目錄樹中所提取的網頁進行注入檢測。
下面結合附圖詳細描述本發明。
如圖1所示,基于網頁模板匹配的漏洞掃描對象精簡方法包括如下步驟:
(1)維護一個掃描網站的目錄樹,目錄樹的每個節點均為一個目錄;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于金華比奇網絡技術有限公司,未經金華比奇網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310374770.8/2.html,轉載請聲明來源鉆瓜專利網。





