[發明專利]一種URL識別率的分析方法及裝置有效
| 申請號: | 202010207359.1 | 申請日: | 2020-03-23 |
| 公開(公告)號: | CN111460337B | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 尹志勇 | 申請(專利權)人: | 武漢思普崚技術有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 北京弘權知識產權代理有限公司 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 430070 湖北省武漢市東湖新技術開發區光谷大道3*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 url 識別率 分析 方法 裝置 | ||
1.一種URL識別率的分析方法,其特征在于,所述方法應用于用戶終端,用戶終端以遠程登錄的方式與審計產品建立連接,所述方法包括:
獲取審計產品的URL列表,所述URL列表用于存儲審計產品在任意時刻所審計的URL;
獲取預設時間段對應的URL集合,所述URL集合中任意一個URL的時間戳在所述預設時間段內;
分別統計所述URL集合中未識別URL和已識別URL的數量;
計算所述已識別URL在所述URL集合中的占比,將所述占比作為URL識別率。
2.根據權利要求1所述的分析方法,其特征在于,分別統計所述URL集合中未識別URL和已識別URL的數量,包括:
根據所述URL集合中URL對應的第一特征信息,將所述URL集合劃分為兩個URL子集合,所述URL子集合分別為第一URL子集合和第二URL子集合,其中,所述第一URL子集合中的URL為已識別URL,所述第二URL子集合中的URL為未識別URL,所述第一特征信息指示所述URL集合中的URL是否被識別;
將所述第一URL子集合中URL的數量作為所述URL集合中已識別URL的數量,將所述第二URL子集合中URL的數量作為所述URL集合中未識別URL的數量。
3.根據權利要求2所述的分析方法,其特征在于,在根據所述URL集合中URL對應的第一特征信息,將所述URL集合劃分為兩個URL子集合之后,還包括:
在所述URL子集合中,判斷是否存在第二特征信息相同的第一目標URL,其中,所述第二特征信息指示所述URL子集合中URL的域名;
如果存在,則對所述第一目標URL執行去重操作。
4.根據權利要求1所述的分析方法,其特征在于,在計算所述已識別URL在所述URL集合中的占比,將所述占比作為URL識別率之后,還包括:
判斷所述URL識別率是否低于預設閾值;
如果是,下載所述URL集合中的未識別URL;
根據所述未識別URL對應的第三特征信息,將所述未識別URL劃分為第一組未識別URL和第二組未識別URL,其中,所述第三特征信息指示所述未識別URL的通信協議;
在各組未識別URL中,判斷是否存在第四特征信息相同的第二目標URL,其中,所述第四特征信息指示所述未識別URL對應的資源的地址;
如果存在,則統計所述第二目標URL的重復次數,并對所述第二目標URL執行去重操作。
5.根據權利要求4所述的分析方法,其特征在于,在統計所述第二目標URL的重復次數,并對所述第二目標URL執行去重操作之后,還包括:
將各組未識別URL執行去重操作后剩余的未識別URL作為第三目標URL,判斷所述第三目標URL是否合法;
如果是,則將合法的第三目標URL添加至URL庫。
6.一種URL識別率的分析裝置,其特征在于,所述裝置應用于用戶終端,用戶終端以遠程登錄的方式與審計產品建立連接,所述裝置包括:
第一獲取模塊,用于獲取審計產品的URL列表,所述URL列表用于存儲審計產品在任意時刻所審計的URL;
第二獲取模塊,用于獲取預設時間段對應的URL集合,所述URL集合中任意一個URL的時間戳在所述預設時間段內;
統計模塊,用于分別統計所述URL集合中未識別URL和已識別URL的數量;
計算模塊,用于計算所述已識別URL在所述URL集合中的占比,將所述占比作為URL識別率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢思普崚技術有限公司,未經武漢思普崚技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010207359.1/1.html,轉載請聲明來源鉆瓜專利網。





