[發明專利]用于識別敏感網頁的方法、裝置、計算機系統和介質在審
| 申請號: | 202010118033.1 | 申請日: | 2020-02-25 |
| 公開(公告)號: | CN113378172A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 李斌;李國輝;李凱 | 申請(專利權)人: | 奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司 |
| 主分類號: | G06F21/57 | 分類號: | G06F21/57;G06F16/951;G06F16/9532;G06F16/955;G06F16/958 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 鄢功軍 |
| 地址: | 100088 北京市西城區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 識別 敏感 網頁 方法 裝置 計算機系統 介質 | ||
本公開提供了一種用于識別敏感網頁的方法,包括:獲取目標網絡空間中的網絡資產,其中,網絡資產包括多種類型的資產;從網絡資產中確定網頁資產;以及對網頁資產中的網頁進行識別,以確定網頁資產中的敏感網頁。本公開還提供了一種用于識別敏感網頁的裝置、一種計算機系統、一種計算機可讀存儲介質和一種計算機程序產品。
技術領域
本公開涉及一種用于識別敏感網頁的方法、一種用于識別敏感網頁的裝置、一種計算機系統、一種計算機可讀存儲介質和一種計算機程序產品。
背景技術
隨著企業業務的不斷壯大,業務信息化的高速發展,各種業務支撐平臺和管理系統越來越復雜。網絡資產,如主機操作系統、數據庫、中間件、應用組件、服務器、存儲設備、網絡設備、安全設備等,數量越積越多,類型也越來越豐富,導致管理員的資產管理工作也愈發困難。如果這些網絡資產沒有納入管理員日常維護范圍內,將會出現越來越多的漏洞及違規配置,進而會給企業安全帶來極大隱患,成為企業信息安全的軟肋。因此,需要經常對網絡資產進行維護,例如,進行安全性檢測。
但在實現本公開的過程中,發明人發現,相關技術中對網絡資產的資產屬性挖掘不深入,導致運營維護工作量增大,并進一步導致運營工作的時效性變差。
發明內容
本公開的一個方面提供了一種用于識別敏感網頁的方法,包括:獲取目標網絡空間中的網絡資產,其中,上述網絡資產包括多種類型的資產;從上述網絡資產中確定網頁資產;以及對上述網頁資產中的網頁進行識別,以確定上述網頁資產中的敏感網頁。
可選地,對上述網頁資產中的網頁進行識別,以確定上述網頁資產中的敏感網頁包括:針對上述網頁資產中的每一個網頁,利用無頭瀏覽器加載與待識別的當前網頁對應的統一資源地址所指向的靜態內容;解析上述靜態內容的頁面結構,以確定上述當前網頁中是否存在待執行腳本;在確定上述當前網頁中存在上述待執行腳本的情況下,執行上述待執行腳本,獲取動態內容;以及對上述當前網頁的靜態內容和動態內容進行識別,以確定上述當前網頁是否為敏感網頁。
可選地,對上述當前網頁的靜態內容和動態內容進行識別,以確定上述當前網頁是否為敏感網頁包括:將上述當前網頁的靜態內容和動態內容與敏感詞集合中的敏感詞進行敏感性特征匹配,得到匹配結果;根據上述匹配結果對上述當前網頁進行敏感性打分,得到打分結果;以及根據上述打分結果確定上述當前網頁是否為敏感網頁。
可選地,上述敏感詞集合至少包括第一敏感詞集合和第二敏感詞集合,上述第一敏感詞集合被分配有第一權重值,上述第二敏感詞集合被分配有第二權重值,上述第一敏感詞集合中的敏感詞和上述第二敏感詞集合中的敏感詞不同,上述第一敏感詞集合和上述第二敏感詞集合分別用于匹配網頁中不同部分的內容,其中:
將上述當前網頁的靜態內容和動態內容與敏感詞集合中的敏感詞進行敏感性特征匹配,得到匹配結果包括:將上述當前網頁的頁面內容按照頁面標簽至少分成第一部分和第二部分,其中,上述頁面內容包括上述靜態內容和上述動態內容;以及
將上述第一部分與上述第一敏感詞集合中的敏感詞進行敏感性特征匹配,得到第一匹配結果;將上述第二部分與上述第二敏感詞集合中的敏感詞進行敏感性特征匹配,得到第二匹配結果。
根據上述匹配結果對上述當前網頁進行敏感性打分,得到打分結果包括:根據上述第一匹配結果、上述第二匹配結果、上述第一權重值和上述第二權重值對上述當前網頁進行敏感性打分,得到打分結果。
可選地,上述的方法還包括:根據上述匹配結果確定上述當前網頁中與敏感詞匹配的敏感內容;獲取上述敏感內容在上述當前網頁中的位置;以及將上述當前網頁的打分結果和上述敏感內容在上述當前網頁中的位置發送給調用者。
可選地,從上述網絡資產中確定網頁資產包括:識別上述網絡資產中每類資產的協議類型;以及將協議類型屬于超文本傳輸協議類型的資產確定為網頁資產。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司,未經奇安信科技集團股份有限公司;網神信息技術(北京)股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010118033.1/2.html,轉載請聲明來源鉆瓜專利網。





