[發明專利]一種用于Web會話聚合的關鍵Cookies識別方法在審
| 申請號: | 201410181682.0 | 申請日: | 2014-04-28 |
| 公開(公告)號: | CN103944916A | 公開(公告)日: | 2014-07-23 |
| 發明(設計)人: | 陳德華;沈昌干;潘喬;羅昕 | 申請(專利權)人: | 東華大學;上海云屹信息技術有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩 |
| 地址: | 201620 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 web 會話 聚合 關鍵 cookies 識別 方法 | ||
1.一種用于Web會話聚合的關鍵Cookies識別方法,其特征在于,步驟為:
步驟1、獲取Web日志文件,提取出Web日志文件中每條記錄的站點名稱Site;
步驟2、以站點名稱Site為分組依據將Web日志文件中的所有記錄分組,使得同一站點名稱Site的記錄都合并到一個組,并建立其與相應站點名稱Site的對應關系,第i個站點名稱Sitei對應記錄組List[Record]i;
步驟3、在步驟2得到的各個記錄組中提取所有包含用戶信息的Cookie項的名稱,并保存至不同的用戶信息Cookie項名稱列表,第i個站點名稱Sitei對應用戶信息Cookie項名稱列表list[user-Cookies]i;
步驟4、在步驟2得到的各個記錄組中提取所有包含瀏覽網站的終端信息的Cookie項的名稱,并保存至不同的終端信息Cookie項名稱列表,第i個站點名稱Sitei對應終端信息Cookie項名稱列表list[terminal-Cookies]i;
步驟5、將步驟3得到的各用戶信息Cookie項名稱列表與步驟4得到的各終端信息Cookie項名稱列表以站點名稱Site作為等值連接的條件進行連接操作,得到各個站點名稱Site的關鍵Cookie項名稱列表,第i個站點名稱Sitei對應關鍵Cookie項名稱列表list[key-Cookies]i。
2.如權利要求1所述的一種用于Web會話聚合的關鍵Cookies識別方法,其特征在于,所述步驟3包括:
步驟3.1、利用正則表達式匹配同一記錄組的所有Cookie項中是否有滿足條件的郵箱信息,若有,則將包含該郵箱信息的Cookie項的名稱放入與當前站點名稱Site對應的用戶信息Cookie項名稱列表中,并進入步驟3.2,若無,直接進入步驟3.2,其中,所使用的正則表達式為:
″^([a-zA-Z0-9_\\.\\-])+\\@(([a-zA-Z0-9\\-])+\\.)+([a-zA-Z]{2,4})+$″;
步驟3.2、利用CookiePicker系統在同一記錄組的所有Cookie項中識別出包含用戶信息的Cookie項的名稱放入與當前站點名稱Site對應的用戶信息Cookie項名稱列表中。
3.如權利要求1所述的一種用于Web會話聚合的關鍵Cookies識別方法,其特征在于,所述步驟4包括:
步驟4.1、計算同一記錄組中,各個Cookie項出現的頻率:
步驟4.2、利用top-k思想,選取出現頻率較高的幾個Cookie項,將這些Cookie項放入與當前站點名稱Site對應的終端信息Cookie項名稱列表中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學;上海云屹信息技術有限公司,未經東華大學;上海云屹信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410181682.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于銅阻擋層應用的摻雜的氮化鉭
- 下一篇:圖像處理裝置





