[發(fā)明專利]一種從Cookie中提取用戶樣本的方法及裝置有效
| 申請?zhí)枺?/td> | 201210552981.1 | 申請日: | 2012-12-18 |
| 公開(公告)號: | CN103870671B | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 陳家耀;歐陽佑;馮是聰;吳明輝 | 申請(專利權(quán))人: | 秒針信息技術(shù)有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京安信方達知識產(chǎn)權(quán)代理有限公司11262 | 代理人: | 栗若木,曲鵬 |
| 地址: | 100102 北京市朝陽*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 cookie 提取 用戶 樣本 方法 裝置 | ||
1.一種從Cookie中提取用戶樣本的方法,其特征在于,該方法包括:
確定所有Cookie之間的相似度,將相似度達到設(shè)定值的Cookie聚為一類Cookie;
針對每一類Cookie,分別生成一份樣本個體及其訪問行為,將生成的所有樣本個體構(gòu)成一份樣本,其中,按照以下方式分別生成各類Cookie對應(yīng)的樣本個體及其訪問行為:
實時統(tǒng)計各類Cookie每個時刻的瀏覽行為的概率分布,利用所述概率分布建立概率分布模型,根據(jù)所述概率分布模型隨機模擬出樣本個體用戶的瀏覽行為,并根據(jù)該類Cookie的個數(shù),計算該類的權(quán)重;
根據(jù)該類Cookie的個數(shù),計算該類的權(quán)重指:
針對各類Cookie,統(tǒng)計每一天中同時存活的此類Cookie的個數(shù),將所統(tǒng)計的最大值作為該類Cookie的權(quán)重。
2.如權(quán)利要求1所述的方法,其特征在于,確定所有Cookie之間的相似度指:
根據(jù)所有Cookie的瀏覽行為計算所有Cookie之間的相似度;或者
根據(jù)所有Cookie的信息和瀏覽行為計算所有Cookie之間的相似度。
3.如權(quán)利要求1或2所述的方法,其特征在于,該方法還包括:
當有新的Cookie加入時,確定新加入的Cookie的相似度,根據(jù)所確定的相似度將新加入的Cookie分到對應(yīng)類別的Cookie中;
重新模擬新加入Cookie的此類Cookie對應(yīng)的的樣本個體用戶的瀏覽行為。
4.如權(quán)利要求1或2所述的方法,其特征在于,實時統(tǒng)計各類Cookie每個時刻的瀏覽行為的概率分布指:
實時統(tǒng)計各類Cookie在各個網(wǎng)站上獨立的瀏覽概率分布;或者
實時統(tǒng)計各類Cookie在多個網(wǎng)站上的聯(lián)合概率分布。
5.如權(quán)利要求4所述的方法,其特征在于,
所述概率分布模型為柏松分布模型。
6.一種從Cookie中提取用戶樣本的裝置,其特征在于,該裝置包括:
分類單元,確定所有Cookie之間的相似度,將相似度達到設(shè)定值的Cookie劃分為一類Cookie;
第一存儲單元,存儲所述分類單元所劃分的各類Cookie及其聚類信息;
統(tǒng)計單元,實時統(tǒng)計所述第一存儲單元中各類Cookie每個時刻的瀏覽行為的概率分布;
模型構(gòu)建器,利用所述統(tǒng)計單元為各類Cookie所統(tǒng)計的概率分布分別為所述第一存儲單元中的各類Cookie建立概率分布模型,根據(jù)各類Cookie的概率分布模型隨機模擬出樣本個體用戶的瀏覽行為;
第二存儲單元,存儲所述模型構(gòu)建器模擬出的各類Cookie的樣本個體用戶的瀏覽行為,并根據(jù)該類Cookie的個數(shù),計算存儲該類的權(quán)重;
第三單元,將所述第二存儲單元存儲的所有樣本個體構(gòu)成一份樣本;
根據(jù)該類Cookie的個數(shù),計算該類的權(quán)重指:
針對各類Cookie,統(tǒng)計每一天中同時存活的此類Cookie的個數(shù),將所統(tǒng)計的最大值作為該類Cookie的權(quán)重。
7.如權(quán)利要求6所述的裝置,其特征在于,所述分類單元確定所有Cookie之間的相似度指:
根據(jù)所有Cookie的瀏覽行為計算所有Cookie之間的相似度;或者
根據(jù)所有Cookie的信息和瀏覽行為計算所有Cookie之間的相似度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于秒針信息技術(shù)有限公司,未經(jīng)秒針信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210552981.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 無線應(yīng)用協(xié)議網(wǎng)關(guān)瀏覽業(yè)務(wù)COOKIE的實現(xiàn)方法
- Cookie信息的管理方法和Cookie服務(wù)器
- 對cookie信息進行處理的方法和服務(wù)器
- cookie處理方法、裝置及瀏覽器、客戶端
- 一種Cookie標識關(guān)聯(lián)方法及裝置
- 一種頁面的下載方法及客戶端
- 一種cookie生命期延長方法、裝置和設(shè)備
- cookie存儲方法、裝置、設(shè)備及可讀存儲介質(zhì)
- Cookie數(shù)據(jù)的處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 網(wǎng)絡(luò)請求cookie的管理方法、裝置、計算機設(shè)備和存儲介質(zhì)





