[發(fā)明專利]一種上網(wǎng)偏好用戶群體的確定方法和設備有效
| 申請?zhí)枺?/td> | 201310752439.5 | 申請日: | 2013-12-31 |
| 公開(公告)號: | CN104750752B | 公開(公告)日: | 2018-06-15 |
| 發(fā)明(設計)人: | 徐萌;何鴻凌;王彥峰;錢嶺;孫少凌 | 申請(專利權)人: | 中國移動通信集團公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京睿博行遠知識產(chǎn)權代理有限公司 11297 | 代理人: | 龔家驊 |
| 地址: | 100032 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶群體 偏好 上網(wǎng) 目標URL 方法和設備 倒排索引 關鍵詞確定 處理效率 快速獲取 數(shù)據(jù)記錄 系統(tǒng)資源 用戶標識 用戶篩選 準確度 靈活度 匹配 篩選 消耗 應用 訪問 | ||
1.一種上網(wǎng)偏好用戶群體的確定方法,其特征在于,包括:
遍歷待分析的用戶上網(wǎng)日志記錄,分別生成所述用戶上網(wǎng)日志記錄中所包括的各URL所對應的倒排索引信息,其中,一個URL所對應的倒排索引信息具體包括訪問所述URL的用戶標識,以及所述用戶標識對所述URL的訪問特征信息;并且,根據(jù)不同的分析周期的需要,對同一個URL分別生成不同時間區(qū)間下所對應的倒排索引信息,并分別攜帶不同的時間戳信息;
當需要確定上網(wǎng)偏好用戶群體時,選擇所述上網(wǎng)偏好用戶群體所對應的一個或多個關鍵詞,并根據(jù)選擇的關鍵詞確定相應的目標URL;
根據(jù)所確定的目標URL所對應的倒排索引信息,確定對所述目標URL的訪問特征信息符合用戶篩選條件的各用戶標識所對應的用戶組成所述上網(wǎng)偏好用戶群體。
2.如權利要求1所述的方法,其特征在于,所述當需要確定上網(wǎng)偏好用戶群體時,選擇所述上網(wǎng)偏好用戶群體所對應的一個或多個關鍵詞,并根據(jù)選擇的關鍵詞確定相應的目標URL,具體包括:
根據(jù)所選擇的關鍵詞所對應的倒排索引信息,確定所述關鍵詞的出現(xiàn)次數(shù)滿足第一URL篩選條件的URL為所述關鍵詞所對應的目標URL,其中,一個關鍵詞所對應的倒排索引信息具體包括含有所述關鍵詞的網(wǎng)頁的URL,以及所述關鍵詞在所述網(wǎng)頁中的出現(xiàn)次數(shù);或,
根據(jù)所選擇的關鍵詞在搜索引擎中的網(wǎng)頁搜索結果,確定滿足第二URL篩選條件的網(wǎng)頁的URL為所述關鍵詞所對應的目標URL。
3.如權利要求2所述的方法,其特征在于,所述當需要確定上網(wǎng)偏好用戶群體時,選擇所述上網(wǎng)偏好用戶群體所對應的一個或多個關鍵詞,并根據(jù)選擇的關鍵詞確定相應的目標URL,還包括:
根據(jù)所選擇的關鍵詞所對應的業(yè)務特征信息,對所確定的目標URL進行篩選。
4.如權利要求1所述的方法,其特征在于,所述根據(jù)所確定的目標URL所對應的倒排索引信息,確定對所述目標URL的訪問特征信息符合用戶篩選條件的各用戶標識所對應的用戶組成所述上網(wǎng)偏好用戶群體,具體包括:
根據(jù)所確定的目標URL所對應的倒排索引信息,及其攜帶的時間戳信息,確定對所述目標URL的訪問次數(shù)和訪問周期符合用戶篩選條件的各用戶標識所對應的用戶組成所述上網(wǎng)偏好用戶群體。
5.一種網(wǎng)絡設備,其特征在于,包括:
生成模塊,用于遍歷待分析的用戶上網(wǎng)日志記錄,分別生成所述用戶上網(wǎng)日志記錄中所包括的各URL所對應的倒排索引信息,其中,一個URL所對應的倒排索引信息具體包括訪問所述URL的用戶標識,以及所述用戶標識對所述URL的訪問特征信息;所述生成模塊,還用于:根據(jù)不同的分析周期的需要,對同一個URL分別生成不同時間區(qū)間下所對應的倒排索引信息,并分別攜帶不同的時間戳信息;
URL篩選模塊,用于在需要確定上網(wǎng)偏好用戶群體時,選擇所述上網(wǎng)偏好用戶群體所對應的一個或多個關鍵詞,并根據(jù)選擇的關鍵詞確定相應的目標URL;
用戶篩選模塊,用于根據(jù)所述生成模塊所生成的與所述URL篩選模塊所確定的目標URL相對應的倒排索引信息,確定對所述目標URL的訪問特征信息符合用戶篩選條件的各用戶標識所對應的用戶組成所述上網(wǎng)偏好用戶群體。
6.如權利要求5所述的網(wǎng)絡設備,其特征在于,所述URL篩選模塊,具體用于:
根據(jù)所選擇的關鍵詞所對應的倒排索引信息,確定所述關鍵詞的出現(xiàn)次數(shù)滿足第一URL篩選條件的URL為所述關鍵詞所對應的目標URL,其中,一個關鍵詞所對應的倒排索引信息具體包括含有所述關鍵詞的網(wǎng)頁的URL,以及所述關鍵詞在所述網(wǎng)頁中的出現(xiàn)次數(shù);或,
根據(jù)所選擇的關鍵詞在搜索引擎中的網(wǎng)頁搜索結果,確定滿足第二URL篩選條件的網(wǎng)頁的URL為所述關鍵詞所對應的目標URL。
7.如權利要求6所述的網(wǎng)絡設備,其特征在于,所述URL篩選模塊,還用于:
根據(jù)所選擇的關鍵詞所對應的業(yè)務特征信息,對所確定的目標URL進行篩選。
8.如權利要求5所述的網(wǎng)絡設備,其特征在于,所述用戶篩選模塊,具體用于:
根據(jù)根據(jù)所述生成模塊所生成的與所述URL篩選模塊所確定的目標URL相對應的倒排索引信息,及其攜帶的時間戳信息,確定對所述目標URL的訪問次數(shù)和訪問周期符合用戶篩選條件的各用戶標識所對應的用戶組成所述上網(wǎng)偏好用戶群體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團公司,未經(jīng)中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310752439.5/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





