[發明專利]一種基于相似度計算的網頁變更監測方法和系統有效
| 申請號: | 201611182671.X | 申請日: | 2016-12-20 |
| 公開(公告)號: | CN106599242B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 劉坤朋;鄭杭;練軍 | 申請(專利權)人: | 福建六壬網安股份有限公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F16/958;G06F21/55;G06F21/56 |
| 代理公司: | 福州科揚專利事務所 35001 | 代理人: | 徐開翟 |
| 地址: | 350015 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 相似 計算 網頁 變更 監測 方法 系統 | ||
1.一種基于相似度計算的網頁變更監測方法,其特征在于,包含以下步驟:
S1:將網絡中的網頁內容通過使用網絡爬蟲存儲至本地存儲設備,計算網頁內容的模糊哈希值;
S2:判斷所述網頁內容屬于第一網頁類型還是屬于第二網頁類型,并作出相應標記,第一網頁類型為網頁內容不會發生變化的網頁,第二網頁類型為網頁內容會發生變化的網頁;
S3:在設定的時間間隔后再次從網絡中爬取所述網頁內容,并計算此刻網頁內容的模糊哈希值;
S4:計算步驟S3中獲得的模糊哈希值與步驟S1中獲得的模糊哈希值的相似度,相似度的取值范圍為0-100;
S5:判斷所述網頁內容所屬網頁類型,若所述網頁內容屬于第一網頁類型,則進行步驟S6;若所述網頁內容屬于第二網頁類型,則進行步驟S7;
S6:判斷相似度的取值是否為100,是,則進行步驟S61;否,則進行步驟S62;
S61:結束所述網頁內容的監測;
S62:發出警告,結束所述網頁內容的監測;
S7:判斷相似度的取值是否為100,是,則結束所述網頁內容的監測;否,則進行步驟S71;
S71:利用DIFF工具找出所述網頁內容相比初始狀態的差異;
S72:判斷差異是否由于圖片變化引起,是,則進行步驟S8;否,則進行步驟S9;
S8:將圖片內容與惡意內容特征進行匹配,檢測圖片中是否有異常內容;是,則進行步驟S81;否,則進行步驟S82;
S81:發出警告,結束所述網頁內容的監測;
S82:結束所述網頁內容的監測;
S9:與敏感詞庫進行匹配,若匹配到敏感詞,則發出警告;
所述步驟S8中調用圖片識別算法對圖片內容進行識別,將圖片內容與惡意內容特征進行匹配,檢測圖片中是否有異常內容;是,則進行步驟S81;否則進行步驟S82。
2.根據權利要求1所述的一種基于相似度計算的網頁變更監測方法,其特征在于,步驟S9中,還包含與木馬特征庫進行匹配,若匹配到木馬特征,則發出警告。
3.一種基于相似度計算的網頁變更監測系統,其特征在于,包含以下模塊:
初始采集模塊:將網絡中的網頁內容通過使用網絡爬蟲存儲至本地存儲設備,計算網頁內容的模糊哈希值;
判斷模塊:判斷所述網頁內容屬于第一網頁類型還是屬于第二網頁類型,并作出相應標記,第一網頁類型為網頁內容不會發生變化的網頁,第二網頁類型為網頁內容會發生變化的網頁;
實時采集模塊:在設定的時間間隔后再次從網絡中爬取所述網頁內容,并計算此刻網頁內容的模糊哈希值;
計算模塊:計算實時采集模塊中獲得的模糊哈希值與初始采集模塊中獲得的模糊哈希值的相似度,相似度的取值范圍為0-100;
網頁判斷模塊:判斷所述網頁內容所屬網頁類型,若所述網頁內容屬于第 一網頁類型,則轉入第一判斷模塊;若所述網頁內容屬于第二網頁類型,則轉入第二判斷模塊;
第一判斷模塊:判斷相似度的取值是否為100,是,則結束所述網頁內容的監測;否,則轉入第一警告模塊;
第一警告模塊:發出警告,結束所述網頁內容的監測;
第二判斷模塊:判斷相似度的取值是否為100,是,則轉入第一終止模塊;否,則轉入差異分析模塊;
第一終止模塊:結束所述網頁內容的監測;
差異分析模塊:利用DIFF工具找出所述網頁內容相比初始狀態的差異;轉入第三判斷模塊;
第三判斷模塊:判斷差異是否由于圖片變化引起,是,則轉入第一匹配模塊;否,則轉入第二匹配模塊;
第一匹配模塊:將圖片內容與惡意內容特征進行匹配,檢測圖片中是否有異常內容;是,則轉入第二警告模塊;否,則轉入第二終止模塊;
第二警告模塊:發出警告,結束所述網頁內容的監測;
第二終止模塊:結束所述網頁內容的監測;
第二匹配模塊:與敏感詞庫進行匹配,若匹配到敏感詞,則發出警告;
第三判斷模塊中調用圖片識別算法對圖片內容進行識別,判斷差異是否由于圖片變化引起,是,則轉入第一匹配模塊;否,則轉入第二匹配模塊。
4.根據權利要求3所述的一種基于相似度計算的網頁變更監測系統,其特征在于,所述第二匹配模塊還包含與木馬特征庫進行匹配,若匹配到木馬特征,則發出警告。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建六壬網安股份有限公司,未經福建六壬網安股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611182671.X/1.html,轉載請聲明來源鉆瓜專利網。





