[發明專利]用于識別敏感網頁的方法、裝置、計算機系統和介質在審
| 申請號: | 202010118033.1 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN113378172A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 李斌;李國輝;李凱 | 申請(專利權)人: | 奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司 |
| 主分類號: | G06F21/57 | 分類號: | G06F21/57;G06F16/951;G06F16/9532;G06F16/955;G06F16/958 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 鄢功軍 |
| 地址: | 100088 北京市西城區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 敏感 網頁 方法 裝置 計算機系統 介質 | ||
1.一種用于識別敏感網頁的方法,包括:
獲取目標網絡空間中的網絡資產,其中,所述網絡資產包括多種類型的資產;
從所述網絡資產中確定網頁資產;以及
對所述網頁資產中的網頁進行識別,以確定所述網頁資產中的敏感網頁。
2.根據權利要求1所述的方法,其中,對所述網頁資產中的網頁進行識別,以確定所述網頁資產中的敏感網頁包括:
針對所述網頁資產中的每一個網頁,利用無頭瀏覽器加載與待識別的當前網頁對應的統一資源地址所指向的靜態內容;
解析所述靜態內容的頁面結構,以確定所述當前網頁中是否存在待執行腳本;
在確定所述當前網頁中存在所述待執行腳本的情況下,執行所述待執行腳本,獲取動態內容;以及
對所述當前網頁的靜態內容和動態內容進行識別,以確定所述當前網頁是否為敏感網頁。
3.根據權利要求2所述的方法,其中,對所述當前網頁的靜態內容和動態內容進行識別,以確定所述當前網頁是否為敏感網頁包括:
將所述當前網頁的靜態內容和動態內容與敏感詞集合中的敏感詞進行敏感性特征匹配,得到匹配結果;
根據所述匹配結果對所述當前網頁進行敏感性打分,得到打分結果;以及
根據所述打分結果確定所述當前網頁是否為敏感網頁。
4.根據權利要求3所述的方法,其中,所述敏感詞集合至少包括第一敏感詞集合和第二敏感詞集合,所述第一敏感詞集合被分配有第一權重值,所述第二敏感詞集合被分配有第二權重值,所述第一敏感詞集合中的敏感詞和所述第二敏感詞集合中的敏感詞不同,所述第一敏感詞集合和所述第二敏感詞集合分別用于匹配網頁中不同部分的內容,其中:
將所述當前網頁的靜態內容和動態內容與敏感詞集合中的敏感詞進行敏感性特征匹配,得到匹配結果包括:
將所述當前網頁的頁面內容按照頁面標簽至少分成第一部分和第二部分,其中,所述頁面內容包括所述靜態內容和所述動態內容;以及
將所述第一部分與所述第一敏感詞集合中的敏感詞進行敏感性特征匹配,得到第一匹配結果;
將所述第二部分與所述第二敏感詞集合中的敏感詞進行敏感性特征匹配,得到第二匹配結果;
根據所述匹配結果對所述當前網頁進行敏感性打分,得到打分結果包括:
根據所述第一匹配結果、所述第二匹配結果、所述第一權重值和所述第二權重值對所述當前網頁進行敏感性打分,得到打分結果。
5.根據權利要求3或4所述的方法,還包括:
根據所述匹配結果確定所述當前網頁中與敏感詞匹配的敏感內容;
獲取所述敏感內容在所述當前網頁中的位置;以及
將所述當前網頁的打分結果和所述敏感內容在所述當前網頁中的位置發送給調用者。
6.根據權利要求1所述的方法,其中,從所述網絡資產中確定網頁資產包括:
識別所述網絡資產中每類資產的協議類型;以及
將協議類型屬于超文本傳輸協議類型的資產確定為網頁資產。
7.一種用于識別敏感網頁的裝置,包括:
獲取模塊,用于獲取目標網絡空間中的網絡資產,其中,所述網絡資產包括多種類型的資產;
確定模塊,用于從所述網絡資產中確定網頁資產;以及
識別模塊,用于對所述網頁資產中的網頁進行識別,以確定所述網頁資產中的敏感網頁。
8.一種計算機系統,包括:
一個或多個處理器;
可讀存儲介質,用于存儲一個或多個程序,
其中,當所述一個或多個程序被所述一個或多個處理器執行時,使得所述一個或多個處理器實現權利要求1至6中任一項所述的方法。
9.一種計算機可讀存儲介質,其上存儲有可執行指令,該指令被處理器執行時使處理器實現權利要求1至6中任一項所述的方法。
10.一種計算機程序產品,包括可執行指令,該指令被處理器執行時使處理器實現權利要求1至6中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司,未經奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010118033.1/1.html,轉載請聲明來源鉆瓜專利網。





