[發(fā)明專利]網(wǎng)絡(luò)訪問分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011437017.5 | 申請日: | 2020-12-11 |
| 公開(公告)號: | CN112579931A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 梁廣鵬 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 毛丹 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 網(wǎng)絡(luò) 訪問 分析 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種網(wǎng)絡(luò)訪問分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。所述方法包括:獲取目標(biāo)訪問地址集合;所述目標(biāo)訪問地址集合包括多個(gè)目標(biāo)訪問地址;提取各個(gè)目標(biāo)訪問地址中包含的目標(biāo)字段和對應(yīng)的字段值;基于同一目標(biāo)字段對應(yīng)的各個(gè)字段值的特征信息確定對應(yīng)的目標(biāo)字段的字段類型;基于各個(gè)目標(biāo)字段和對應(yīng)的字段類型生成所述目標(biāo)訪問地址集合對應(yīng)的訪問解析結(jié)果;所述訪問解析結(jié)果用于對待處理訪問地址進(jìn)行訪問處理。采用本方法能夠提高訪問查詢、訪問分析的效率。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)絡(luò)訪問分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,網(wǎng)絡(luò)上的信息資源日益豐富。用戶可以通過URL(UniformResource Locator,統(tǒng)一資源定位符)訪問網(wǎng)絡(luò)上的資源。URL是指信息資源在網(wǎng)絡(luò)上統(tǒng)一且唯一的地址。
傳統(tǒng)技術(shù)中,對于URL的查詢,用戶需要準(zhǔn)確知道待查詢URL中包含的參數(shù),基于已知參數(shù)去查詢相應(yīng)的URL。然而,對于未知參數(shù)的URL,用戶就無法查詢到對應(yīng)的URL,導(dǎo)致URL查詢效率低。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高URL查詢效率的網(wǎng)絡(luò)訪問分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
一種網(wǎng)絡(luò)訪問分析方法,所述方法包括:
獲取目標(biāo)訪問地址集合;目標(biāo)訪問地址集合包括多個(gè)目標(biāo)訪問地址;
提取各個(gè)目標(biāo)訪問地址中包含的目標(biāo)字段和對應(yīng)的字段值;
基于同一目標(biāo)字段對應(yīng)的各個(gè)字段值的特征信息確定對應(yīng)的目標(biāo)字段的字段類型;
基于各個(gè)目標(biāo)字段和對應(yīng)的字段類型生成目標(biāo)訪問地址集合對應(yīng)的訪問解析結(jié)果;訪問解析結(jié)果用于對待處理訪問地址進(jìn)行訪問處理。
在一個(gè)實(shí)施例中,獲取目標(biāo)訪問地址集合,包括:獲取多個(gè)候選訪問地址;將同一訪問接口對應(yīng)的候選訪問地址進(jìn)行聚合,得到各個(gè)訪問接口對應(yīng)的候選訪問地址集合;從各個(gè)候選訪問地址集合中確定所述目標(biāo)訪問地址集合。
在一個(gè)實(shí)施例中,將同一訪問接口對應(yīng)的候選訪問地址進(jìn)行聚合,得到各個(gè)訪問接口對應(yīng)的候選訪問地址集合,包括:提取候選訪問地址中包含的訪問主機(jī)信息和訪問路徑信息;將同一訪問主機(jī)信息、訪問路徑信息對應(yīng)的候選訪問地址進(jìn)行聚合,得到各個(gè)訪問接口對應(yīng)的候選訪問地址集合。
在一個(gè)實(shí)施例中,提取各個(gè)目標(biāo)訪問地址中包含的目標(biāo)字段和對應(yīng)的字段值,包括:獲取分割標(biāo)識符;基于分割標(biāo)識符將目標(biāo)訪問地址分割為多個(gè)候選字段和對應(yīng)的候選字段值;基于分割標(biāo)識符的類型從多個(gè)候選字段中確定目標(biāo)字段,得到目標(biāo)字段和對應(yīng)的字段值。
在一個(gè)實(shí)施例中,基于同一目標(biāo)字段對應(yīng)的各個(gè)字段值的特征信息確定對應(yīng)的目標(biāo)字段的字段類型,包括:統(tǒng)計(jì)當(dāng)前字段對應(yīng)的各個(gè)字段值中各個(gè)字符的出現(xiàn)次數(shù)和當(dāng)前字段對應(yīng)的字段值數(shù)量;基于各個(gè)字符出現(xiàn)的次數(shù)和字段值數(shù)量計(jì)算各個(gè)字符的出現(xiàn)概率;基于各個(gè)字符的出現(xiàn)概率確定字符間的概率距離;當(dāng)概率距離小于第二預(yù)設(shè)閾值時(shí),確定當(dāng)前字段對應(yīng)的字段類型為無效字段類型。
一種網(wǎng)絡(luò)訪問分析裝置,所述裝置包括:
訪問地址獲取模塊,用于獲取目標(biāo)訪問地址集合;目標(biāo)訪問地址集合包括多個(gè)目標(biāo)訪問地址;
字段信息獲取模塊,用于提取各個(gè)目標(biāo)訪問地址中包含的目標(biāo)字段和對應(yīng)的字段值;
字段類型確定模塊,用于基于同一目標(biāo)字段對應(yīng)的各個(gè)字段值的特征信息確定對應(yīng)的目標(biāo)字段的字段類型;
訪問解析結(jié)果確定模塊,用于基于各個(gè)目標(biāo)字段和對應(yīng)的字段類型生成目標(biāo)訪問地址集合對應(yīng)的訪問解析結(jié)果;訪問解析結(jié)果用于對待處理訪問地址進(jìn)行訪問處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011437017.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點(diǎn)網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動(dòng)終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動(dòng)恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置
- 存儲器訪問調(diào)度裝置、調(diào)度方法與存儲器訪問控制系統(tǒng)
- 一種限制用戶訪問的方法和裝置
- 一種訪問信息提供方法及系統(tǒng)
- 數(shù)據(jù)訪問權(quán)限的控制方法及裝置
- 基于智能家居系統(tǒng)的訪問授權(quán)方法、裝置及設(shè)備
- 網(wǎng)站訪問請求的動(dòng)態(tài)調(diào)度方法及裝置
- 基于訪問頻率的監(jiān)測方法、裝置、設(shè)備和計(jì)算機(jī)存儲介質(zhì)
- 訪問憑證驗(yàn)證方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)
- 一種應(yīng)用訪問控制方法、系統(tǒng)和介質(zhì)
- 異常訪問行為的檢測方法、裝置、電子設(shè)備及存儲介質(zhì)





