[發明專利]一種網站內容篡改檢測方法、裝置、設備及可讀存儲介質有效
| 申請號: | 201810866015.4 | 申請日: | 2018-08-01 |
| 公開(公告)號: | CN109104421B | 公開(公告)日: | 2021-09-17 |
| 發明(設計)人: | 龐思銘 | 申請(專利權)人: | 深信服科技股份有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;G06F16/953 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網站 內容 篡改 檢測 方法 裝置 設備 可讀 存儲 介質 | ||
1.一種網站內容篡改檢測方法,其特征在于,包括:
接收待檢測的目標網站域名;
利用瀏覽器測試框架驅動搜索引擎對所述目標網站域名進行搜索,獲得與所述目標網站域名對應的待檢測頁面;
利用篡改頁面檢測技術對所述待檢測頁面的頁面內容進行檢測,識別被篡改的頁面;
其中,所述利用瀏覽器測試框架驅動搜索引擎對所述目標網站域名進行搜索,獲得與所述目標網站域名對應的待檢測頁面,包括:
對所述目標網站域名進行拆分;
將拆分的目標網站域名與操作符、黑詞庫中的黑詞進行組合,生成多個字符串組合;
利用瀏覽器測試框架驅動搜索引擎對每個字符串組合進行搜索,對搜索結果進行篩選后,獲取與每個字符串組合對應的待檢測頁面。
2.根據權利要求1所述的網站內容篡改檢測方法,其特征在于,所述對搜索結果進行篩選后,獲取與每個字符串組合對應的待檢測頁面,包括:
去除所述搜索結果中搜索結果域名與所述目標網站域名無關、搜索結果標題或摘要中不包括黑詞,得到篩選后的搜索結果;
確定與每個篩選后的搜索結果對應的原始頁面地址;
對搜索參數進行動態組合變化,利用變化后的搜索參數訪問所述原始頁面地址,得到搜索后的頁面地址;
將所述原始頁面地址,以及與所述原始頁面地址不同的搜索后的頁面地址作為最終的頁面地址,下載與最終的頁面地址對應的待檢測頁面。
3.根據權利要求1或2所述的網站內容篡改檢測方法,其特征在于,所述利用篡改頁面檢測技術對所述待檢測頁面的頁面內容進行檢測,識別被篡改的頁面,包括:
獲取待檢測頁面內的頁面內容;
利用預先構建的黑詞庫檢測所述頁面內容中的黑詞,并統計每個黑詞在所述頁面內容中出現的次數;
根據所述黑詞庫,確定每個黑詞的詞頻差;所述詞頻差為黑詞在黑樣本中存在的概率與黑詞在白樣本中存在的概率之差;
利用每個黑詞的詞頻差以及每個黑詞在所述頁面內容中出現的次數,確定所述待檢測頁面的篡改判定值,若所述篡改判定值大于預先設定的篡改閾值,則判定所述待檢測頁面為篡改頁面。
4.根據權利要求3所述的網站內容篡改檢測方法,其特征在于,所述利用每個黑詞的詞頻差以及每個黑詞在所述頁面內容中出現的次數,確定所述待檢測頁面的篡改判定值之前,還包括:
檢測所述頁面內容中黑域名的數量;
則所述利用每個黑詞的詞頻差以及每個黑詞在所述頁面內容中出現的次數,確定所述待檢測頁面的篡改判定值,包括:
利用每個黑詞的詞頻差、每個黑詞在所述頁面內容中出現的次數、所述頁面內容中黑域名的數量、以及黑域名篡改權值,確定所述待檢測頁面的篡改判定值。
5.根據權利要求4所述的網站內容篡改檢測方法,其特征在于,所述利用每個黑詞的詞頻差、每個黑詞在所述頁面內容中出現的次數、所述頁面內容中黑域名的數量、以及黑域名篡改權值,確定所述待檢測頁面的篡改判定值,包括:
利用篡改判定值確定規則,計算篡改判定值;
所述篡改判定值確定規則為:;
其中,為所述頁面內容中黑域名的數量,為黑域名篡改權值,為黑詞的總數量,為第個黑詞的詞頻差,為第個黑詞在所述頁面內容中出現的次數。
6.一種網站內容篡改檢測裝置,其特征在于,包括:
接收模塊,用于接收待檢測的目標網站域名;
待檢測頁面獲取模塊,用于利用瀏覽器測試框架驅動搜索引擎對所述目標網站域名進行搜索,獲得與所述目標網站域名對應的待檢測頁面;
檢測模塊,用于利用篡改頁面檢測技術對所述待檢測頁面的頁面內容進行檢測,識別被篡改的頁面;
其中,所述待檢測頁面獲取模塊,包括:
域名拆分單元,用于對所述目標網站域名進行拆分;
組合單元,用于將拆分的目標網站域名與操作符、黑詞庫中的黑詞進行組合,生成多個字符串組合;
搜索單元,用于利用瀏覽器測試框架驅動搜索引擎對每個字符串組合進行搜索;
頁面獲取單元,用于對搜索結果進行篩選后,獲取與每個字符串組合對應的待檢測頁面。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深信服科技股份有限公司,未經深信服科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810866015.4/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





