[發明專利]一種網站安全監測方法及裝置有效
| 申請號: | 201710812031.0 | 申請日: | 2017-09-11 |
| 公開(公告)號: | CN107547555B | 公開(公告)日: | 2021-04-16 |
| 發明(設計)人: | 張樂平;張博;李海峰;侯磊 | 申請(專利權)人: | 北京匠數科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 何少巖 |
| 地址: | 100089 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網站 安全 監測 方法 裝置 | ||
1.一種網站安全監測方法,其特征在于,所述方法包括:
從目標網站的各個網址所對應的網頁中提取網頁內容信息,所述網頁內容信息包括:視頻信息、圖片信息或文本信息中至少一種;
分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息;
當任一所述網頁中的所述網頁內容信息中存在不良信息時,確定所述目標網站為異常網站;
向所述異常網站對應的管理終端發送提示信息,以使所述管理終端對應的管理人員對所述異常網站進行維護;和/或,關閉所述異常網站的訪問通道或者刪除存在不良信息的異常網頁,以阻止用戶終端繼續訪問所述異常網站或者所述異常網頁;
當所述網頁內容信息包括圖片信息時,所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息,包括:
對待識別的所述圖片信息進行敏感圖像區域提取處理,得到所述圖片信息中的多個敏感圖像區域;
利用不良信息識別模型計算各個所述敏感圖像區域的不良信息匹配度,根據各個所述不良信息匹配度計算所述圖片信息的不良信息存在概率;其中,所述不良信息識別模型是通過如下方式構建:利用深度學習方法對選取的不良信息樣本進行深度神經網絡訓練,得到不良信息識別模型,所述不良信息識別模型為多隱層的機器學習模型,通過收集海量的包含不良信息的圖像、視頻作為所述不良信息樣本,使用所述不良信息樣本對所述不良信息識別模型進行訓練優化特征參數,以在深度學習的過程中不斷提高識別精度;
當所述不良信息存在概率大于第一預設閾值時,確定所述圖片信息中存在不良信息;
當所述網頁內容信息包括文本信息時,所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息,包括:
對待識別的所述文本信息進行分句處理,得到多個獨立的語句;
對多個獨立的所述語句進行關鍵詞分割處理,分析各所述語句中的多個關鍵詞之間的依存關系;
根據所述依存關系,對各所述關鍵詞或多個所述關鍵詞的組合進行負面情感算法識別,判斷各所述語句是否具有負面情感;
基于預先構建的敏感詞匯庫,對各所述關鍵詞進行敏感詞匯識別,判斷各所述語句是否包含敏感詞匯;
如果任一所述語句具有負面情感且包含敏感詞匯,則計算所述文本信息的不良信息存在概率;
當所述不良信息存在概率大于第三預設閾值時,確定所述文本信息中存在不良信息;
當所述網頁內容信息包括視頻信息時,所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息,包括:
對待識別的所述視頻信息進行分幀處理,得到多個視頻幀;
逐一對各個所述視頻幀進行敏感區域提取處理,得到所述視頻幀中的多個敏感區域;
利用不良信息識別模型計算各個所述敏感區域的不良信息匹配度,根據各個所述不良信息匹配度計算所述視頻幀的不良信息存在概率;
當所述不良信息存在概率大于第二預設閾值時,確定所述視頻幀中存在不良信息;
當任一所述視頻幀中存在不良信息時,確定所述視頻信息中存在不良信息;
當任一所述視頻幀中存在不良信息時,確定所述視頻信息中存在不良信息,具體包括:當首次識別到視頻幀為包含不良信息的視頻幀時,將不良視頻幀出現次數加1;
判斷當前累計的所述不良視頻幀出現次數是否大于不良次數閾值;
若是,則確定所述視頻信息中存在不良信息;
當所述網頁內容信息包括視頻信息、圖片信息或文本信息三項類型信息中至少兩項時,所述分別確定各個所述網頁中的所述網頁內容信息中是否存在不良信息,包括:
分別計算各類型信息中每種類型的不良信息對應的不良信息存在概率,所述不良信息包括以下中的至少一種:色情、反動、暴力;
判斷各類型信息中每種類型的不良信息對應的所述不良信息存在概率是否大于所述類型信息中某一類型的不良信息對應的預設閾值;
如果任一所述不良信息存在概率大于對應的預設閾值,則確定所述網頁內容信息中存在不良信息;
如果所有所述不良信息存在概率均不大于對應的預設閾值,則根據各類型信息中每種類型的不良信息對應的所述不良信息存在概率計算各種類型的不良信息對應的綜合不良信息存在概率;
判斷各所述綜合不良信息存在概率是否大于相應類型的不良信息對應的綜合預設閾值;
如果任一所述綜合不良信息存在概率大于對應的綜合預設閾值,則確定所述網頁內容信息中存在不良信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京匠數科技有限公司,未經北京匠數科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710812031.0/1.html,轉載請聲明來源鉆瓜專利網。





