[發明專利]一種網站安全監測方法及裝置有效

申請號：	201710812031.0	申請日：	2017-09-11
公開（公告）號：	CN107547555B	公開（公告）日：	2021-04-16
發明（設計）人：	張樂平;張博;李海峰;侯磊	申請（專利權）人：	北京匠數科技有限公司
主分類號：	H04L29/06	分類號：	H04L29/06
代理公司：	北京超凡宏宇專利代理事務所(特殊普通合伙) 11463	代理人：	何少巖
地址：	100089 北京市海淀區中***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種網站安全監測方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種網站安全監測方法，其特征在于，所述方法包括：

從目標網站的各個網址所對應的網頁中提取網頁內容信息，所述網頁內容信息包括：視頻信息、圖片信息或文本信息中至少一種；

分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息；

當任一所述網頁中的所述網頁內容信息中存在不良信息時，確定所述目標網站為異常網站；

向所述異常網站對應的管理終端發送提示信息，以使所述管理終端對應的管理人員對所述異常網站進行維護；和/或，關閉所述異常網站的訪問通道或者刪除存在不良信息的異常網頁，以阻止用戶終端繼續訪問所述異常網站或者所述異常網頁；

當所述網頁內容信息包括圖片信息時，所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息，包括：

對待識別的所述圖片信息進行敏感圖像區域提取處理，得到所述圖片信息中的多個敏感圖像區域；

利用不良信息識別模型計算各個所述敏感圖像區域的不良信息匹配度，根據各個所述不良信息匹配度計算所述圖片信息的不良信息存在概率；其中，所述不良信息識別模型是通過如下方式構建：利用深度學習方法對選取的不良信息樣本進行深度神經網絡訓練，得到不良信息識別模型，所述不良信息識別模型為多隱層的機器學習模型，通過收集海量的包含不良信息的圖像、視頻作為所述不良信息樣本，使用所述不良信息樣本對所述不良信息識別模型進行訓練優化特征參數，以在深度學習的過程中不斷提高識別精度；

當所述不良信息存在概率大于第一預設閾值時，確定所述圖片信息中存在不良信息；

當所述網頁內容信息包括文本信息時，所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息，包括：

對待識別的所述文本信息進行分句處理，得到多個獨立的語句；

對多個獨立的所述語句進行關鍵詞分割處理，分析各所述語句中的多個關鍵詞之間的依存關系；

根據所述依存關系，對各所述關鍵詞或多個所述關鍵詞的組合進行負面情感算法識別，判斷各所述語句是否具有負面情感；

基于預先構建的敏感詞匯庫，對各所述關鍵詞進行敏感詞匯識別，判斷各所述語句是否包含敏感詞匯；

如果任一所述語句具有負面情感且包含敏感詞匯，則計算所述文本信息的不良信息存在概率；

當所述不良信息存在概率大于第三預設閾值時，確定所述文本信息中存在不良信息；

當所述網頁內容信息包括視頻信息時，所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息，包括：

對待識別的所述視頻信息進行分幀處理，得到多個視頻幀；

逐一對各個所述視頻幀進行敏感區域提取處理，得到所述視頻幀中的多個敏感區域；

利用不良信息識別模型計算各個所述敏感區域的不良信息匹配度，根據各個所述不良信息匹配度計算所述視頻幀的不良信息存在概率；