[發明專利]一種惡意注入腳本網頁檢測方法和系統有效
| 申請號: | 200710303985.5 | 申請日: | 2007-12-24 |
| 公開(公告)號: | CN101471818A | 公開(公告)日: | 2009-07-01 |
| 發明(設計)人: | 葉潤國;胡振宇;朱錢杭;李博;駱擁政;牛妍萍 | 申請(專利權)人: | 北京啟明星辰信息技術股份有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L29/06;G06F17/30 |
| 代理公司: | 北京市商泰律師事務所 | 代理人: | 毛燕生 |
| 地址: | 100094北京市海淀區東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 惡意 注入 腳本 網頁 檢測 方法 系統 | ||
1.一種惡意注入腳本網頁檢測方法,其特征在于包括以下步驟:
1)使用網頁爬蟲遍歷并下載被掃描網站的所有網頁的步驟;
2)對下載網頁進行聚類分析的步驟;
3)提取各動態內容網頁簇的網頁簇模板的步驟;
4)利用網頁簇模板檢測簇中各動態內容網頁是否包含惡意注入腳本的步驟;
步驟4)所述的利用網頁簇模板檢測簇中各網頁是否包含惡意注入腳本的步驟包括以下步驟:
i)對于每一動態內容網頁簇,將簇中每一動態網頁轉換為文檔對象模型樹,并與該網頁簇模板相比較,找到超出網頁簇模板輪廓的各個文檔對象模型子樹;
ii)對于超出網頁簇模板輪廓的各文檔對象模型子樹,從中提取注入腳本;
iii)對提取的注入腳本進行語法正確性檢測,如果語法正確,則確認其宿主動態內容網頁為包含惡意注入腳本的網頁。
2.如權利要求1所述的惡意注入腳本網頁檢測方法,其特征在于,所述的對下載網頁進行聚類分析的步驟包括以下步驟:
1)對下載的網頁集合進行預處理,過濾掉那些與靜態Web對象請求相關的網頁,只保留那些與動態Web對象請求相關的動態內容網頁;
2)根據網頁統一資源定位符URL對動態內容網頁進行聚類,得到聚類后的動態內容網頁簇。
3.如權利要求1所述的惡意注入腳本網頁檢測方法,其特征在于,所述的提取各動態內容網頁簇的網頁簇模板的步驟為:對于每一動態內容網頁簇,提取其所共有的文檔對象模型樹作為該動態內容網頁簇模板。
4.如權利要求1所述的惡意注入腳本網頁檢測方法,其特征在于,所述的從超出網頁簇模板輪廓的文檔對象模型子樹中提取注入腳本的步驟為以下5種腳本提取方法的任意組合:
1)從文檔對象模型樹各<script>標簽中提取Javascript/VBScript腳本;
2)從文檔對象模型樹各HTML標簽的事件驅動函數中提取Javascript/VBScript腳本;
3)從文檔對象模型樹各HTML標簽的特定屬性值中提取Javascript/VBScript腳本;
4)從文檔對象模型樹各<STYLE>標簽定義的樣式表中提取Javascript/VBScript腳本;
5)從文檔對象模型樹各HTML標簽的Style屬性引入的樣式表中提取JavaScript/VBScript腳本。
5.如權利要求1所述的一種惡意注入腳本網頁檢測方法,其特征在于,所述的對提取的注入腳本進行語法檢測支持對兩種注入腳本語言的檢測:如果提取的腳本為Javascript腳本,則采用標準Javascript語法規范對提取的JavaScript腳本進行語法檢測;如果提取的腳本類型為VBScript,則采用標準VBScript語法規范對提取的VBScript腳本進行語法檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京啟明星辰信息技術股份有限公司,未經北京啟明星辰信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710303985.5/1.html,轉載請聲明來源鉆瓜專利網。





