[發(fā)明專利]對URL進(jìn)行分類的方法和裝置有效
| 申請?zhí)枺?/td> | 201510733512.3 | 申請日: | 2015-11-03 |
| 公開(公告)號: | CN106649384B | 公開(公告)日: | 2019-07-09 |
| 發(fā)明(設(shè)計)人: | 趙鈞;石屹嶸;黃磊;邱晨旭 | 申請(專利權(quán))人: | 中國電信股份有限公司 |
| 主分類號: | G06F16/955 | 分類號: | G06F16/955 |
| 代理公司: | 中國國際貿(mào)易促進(jìn)委員會專利商標(biāo)事務(wù)所 11038 | 代理人: | 方亮 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | url 進(jìn)行 分類 方法 裝置 | ||
1.一種對URL進(jìn)行分類的方法,其特征在于,包括:
獲取訪問URL的各用戶的用戶特征信息和各用戶訪問該URL的訪問次數(shù),所述用戶特征信息包括基于用戶歷史上網(wǎng)行為確定的用戶標(biāo)簽和各用戶標(biāo)簽的權(quán)重;
根據(jù)獲取到的各用戶的用戶特征信息和各用戶訪問URL的訪問次數(shù)確定URL特征信息,所述URL特征信息包括URL的網(wǎng)頁類型和各網(wǎng)頁類型的權(quán)重;
根據(jù)所述URL特征信息對所述URL進(jìn)行分類;
其中,所述根據(jù)獲取到的各用戶的用戶特征信息和各用戶訪問URL的訪問次數(shù)確定URL特征信息包括:
根據(jù)uj=(xj1×kj1,xj2×kj2,…xjn×kjn)×pj/P計算訪問該URL的每個用戶j的標(biāo)簽向量uj,其中j為正整數(shù),1≤j≤S,S為訪問該URL的用戶總數(shù),xjn為用戶j的用戶標(biāo)簽,kjn為用戶標(biāo)簽xjn的權(quán)重,jn為正整數(shù),pj為用戶j訪問該URL的訪問次數(shù),P為所有用戶訪問該URL的總訪問次數(shù);
將各用戶j的標(biāo)簽向量uj中相同用戶標(biāo)簽的權(quán)重累加,得到該URL的標(biāo)簽向量y=(x1×c1,x2×c2,…,xt×ct),其中xt為用戶標(biāo)簽,用戶標(biāo)簽xt的系數(shù)ct為S個用戶的標(biāo)簽向量uj中與xt相同的用戶標(biāo)簽的權(quán)重之和;
從URL的標(biāo)簽向量y中選擇用戶標(biāo)簽的系數(shù)最大的前m個用戶標(biāo)簽x1,x2,…xm作為該URL的網(wǎng)頁類型,并將作為網(wǎng)頁類型xi的權(quán)重。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
將各用戶j的標(biāo)簽向量uj中相同用戶標(biāo)簽的權(quán)重累加,并按累加后的用戶標(biāo)簽的系數(shù)的大小對用戶標(biāo)簽進(jìn)行排序,得到該URL的標(biāo)簽向量y=(x1×c1,x2×c2,…,xt×ct)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述根據(jù)所述URL特征信息對所述URL進(jìn)行分類包括:
選擇各網(wǎng)頁類型的權(quán)重中最大的一個或多個網(wǎng)頁類型作為所述URL的網(wǎng)頁類型,以對所述URL進(jìn)行分類。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括:
從采集的DPI數(shù)據(jù)中篩選出總訪問次數(shù)大于預(yù)設(shè)閾值的URL作為所述URL。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括:
采集所述URL的網(wǎng)頁內(nèi)容,并根據(jù)所述URL的網(wǎng)頁內(nèi)容和特定算法識別所述URL的網(wǎng)頁類型,以對所述URL進(jìn)行分類;
將分類結(jié)果與根據(jù)所述URL特征信息對所述URL進(jìn)行分類的分類結(jié)果進(jìn)行比較;
根據(jù)比較結(jié)果調(diào)整所述預(yù)設(shè)閾值的大小。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國電信股份有限公司,未經(jīng)中國電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510733512.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:服飾管理方法及系統(tǒng)
- 下一篇:腳凳(61882)
- 一種動態(tài)檢測URL重定向死循環(huán)的方法及裝置
- 一種瀏覽器側(cè)提示訪問安全信息的方法及裝置
- 一種短URL服務(wù)的實(shí)現(xiàn)方法及裝置
- 一種用于發(fā)送和驗(yàn)證URL簽名以進(jìn)行自適應(yīng)流中URL認(rèn)證和基于URL的內(nèi)容訪問授權(quán)的系統(tǒng)和方法
- 提供短統(tǒng)一資源定位符服務(wù)的方法和裝置及通信系統(tǒng)
- 一種URL檢測方法及檢測裝置
- 一種統(tǒng)一資源定位符的去重方法、裝置及電子設(shè)備
- 惡意URL檢測方法及系統(tǒng)
- 一種自身校驗(yàn)發(fā)布和訪問URL的方法、裝置、系統(tǒng)和介質(zhì)
- 一種統(tǒng)一資源定位符URL的處理方法及裝置





