[發明專利]一種采集用戶行為數據的方法及裝置在審
| 申請號: | 201210295725.9 | 申請日: | 2012-08-17 |
| 公開(公告)號: | CN103593376A | 公開(公告)日: | 2014-02-19 |
| 發明(設計)人: | 雷鑫;陳鑼斌;孫宏發;沈濤 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 采集 用戶 行為 數據 方法 裝置 | ||
技術領域
本申請涉及網絡技術領域,尤其涉及一種采集用戶行為數據的方法及裝置。
背景技術
CTU是網絡加護系統中的風險控制管理核心監控系統。主要對盜用、欺詐、盜卡風險進行實時以及非實時監控,控制這些風險導致的資金損失,保障客戶資金安全以及交易安全。
即用戶通過計算機在互聯網站上的行為,如在支付寶的登錄、修改信息、支付資金等操作。
原有方案,在對用戶操作行為數據進行分析時(由于性能瓶頸,只能查詢到最長為當前時間起前6個小時),再從海量數據中查詢最長當前時間前6小時段的所有原始操作流水記錄,獲取到數據后,再進行篩選、分類、統計、匯總,即現用現計算處理。
現有技術缺點:由于現有技術中數據分析是在分析的時候,再從海量數據中查詢最長當前時間前6小時段的所有原始操作流水記錄,獲取到數據后,再進行篩選、分類、統計、匯總,即現用現計算處理,因此性能及效率會比較差。同時,現有技術未將當前原始用戶操作行為數據進行預先設好的多個條件進行篩選、分類、統計、匯總,因此在事后隨著時間的推移,這些歷史數據將無法獲取到當時的一些數據場景快照,或者說獲取到的成本非常高。
發明內容
本申請提供一種采集用戶行為數據的方法及裝置,本申請所提供的方法和裝置解決現有技術中數據分析從海量數據中查詢目標數據,因此數據查詢性能及效率會比較差的問題。
本申請提供一種采集用戶行為數據的方法,該方法包括:
當檢測到任一操作行為發生時,生成與該操作行為對應的操作行為數據;
將所述操作行為數據中的數據項與預設的多個篩選統計策略中的策略項進行匹配,若與任一篩選統計策略匹配成功,則獲取與所述任一篩選統計策略對應的第一篩選統計策略標識;
將第一篩選統計策略標識與所述操作行為數據中的用戶唯一標識組合生成關鍵詞;
將具有相同關鍵詞的操作行為數據存儲到預設的存儲空間。
當從存儲的歷史操作行為數據中獲取任一用戶對任一事件的歷史操作行為數據,該方法還包括:
接收獲取所述任一用戶的歷史操作行為數據的數據獲取請求;
從所述數據獲取請求中獲取與所述任一事件對應的數據篩選統計項,并根據獲取的數據篩選統計項生成篩選統計策略標識;
將生成的篩選統計策略標識與所述任一用戶的唯一標識組合生成關鍵詞;
將生成的關鍵詞與所述數據結構中保存的關鍵詞進行匹配,如果匹配到相同的,則獲取關鍵詞對應的歷史操作行為數據。
本申請根據上述方法還提供一種采集用戶行為數據的裝置,該裝置包括:
數據接收單元,用于當檢測到任一操作行為發生時,獲取與該操作行為對應的操作行為數據;
篩選統計策略標識確定單元,用于將所述操作行為數據中的數據項與預設的多個篩選統計策略中的策略項進行匹配,若與任一篩選統計策略匹配成功,則獲取與所述任一篩選統計策略對應的第一篩選統計策略標識;
關鍵詞生成單元,用于將第一篩選統計策略標識與所述操作行為數據中的用戶唯一標識組合生成關鍵詞;
數據存儲單元,用于將具有相同關鍵詞的操作行為數據存儲到預設的存儲空間。
當從所述預設的存儲空間中獲取任一用戶對任一事件的操作行為數據,則該裝置還包括:
查詢單元,用于接收獲取任一用戶的歷史操作行為數據的數據獲取請求;從所述數據獲取請求中獲取與所述任一事件對應的數據篩選統計項,并根據獲取的數據篩選統計項生成篩選統計策略標識;將生成的篩選統計策略標識與所述任一用戶的唯一標識組合生成關鍵詞;將生成的關鍵詞與所述數據結構中保存的關鍵詞進行匹配,如果匹配到相同的,則獲取關鍵詞對應的歷史操作行為數據。
上述技術方案中的一個或兩個,至少具有如下技術效果:
本申請實施例所提供的方法和裝置通過提前實時的預計算處理,將當前用戶對應的歷史操作行為數據進行預先設好的多個條件進行篩選、分類、統計、匯總,這樣即解決了原來無法解決的對歷史操作行為數據快照問題,使原始用戶操作行為數據的描述更加豐富,以此大大提升用戶行為分析的精度。
附圖說明
圖1為本申請實施例一種采集用戶行為數據的方法的流程圖;
圖2為本申請實施例在本申請實施例中關鍵詞的結構示意圖;
圖3為本申請實施例數據結構中緩存隊列的結構示意圖;
圖4為本申請實施例中基于某一篩選策略的緩存隊列結構示意圖;
圖5為本申請實施例一種采集用戶行為數據裝置的結構示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210295725.9/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





