[發明專利]數據的存儲方法和裝置有效
| 申請號: | 201610730521.1 | 申請日: | 2016-08-25 |
| 公開(公告)號: | CN107783993B | 公開(公告)日: | 2021-11-30 |
| 發明(設計)人: | 葉一舟;張鋒;楊磊 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/95 |
| 代理公司: | 北京博浩百睿知識產權代理有限責任公司 11134 | 代理人: | 宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 存儲 方法 裝置 | ||
1.一種數據的存儲方法,其特征在于,包括:
獲取至少一個操作對象的日志信息,所述日志信息包括:任意一個操作對象的多個行為數據,以及每個行為數據之間跳轉時的關聯因子,所述行為數據是用戶針對操作對象的動作;
基于樹狀存儲結構保存所述任意一個操作對象的行為數據和所述每個行為數據之間跳轉時的關聯因子,得到每個操作對象的網絡行為關系數據,所述網絡行為關系數據用于展示所述用戶在一次會話中的多種行為之間的關系;
以用戶訪問操作對象過程的會話為單位,確定所述會話中包含的多個操作對象;
將所述會話中包含的多個對象的網絡行為關系數據進行關聯存儲,得到所述用戶在所述會話內發生的網絡訪問結果;
其中,在將所述會話中包含的多個對象的網絡行為關系數據進行關聯存儲,得到所述用戶在所述會話內發生的網絡訪問結果之后,所述方法還包括:
還原所述樹狀存儲結構保存的所述網絡行為關系數據和用戶關系數據,得到多層邏輯哈希樹的結構;
對所述多層邏輯哈希樹的結構進行列轉行處理,將多值的列按照列轉行后的順序填充到輸出數據集中,得到基于產品信息的全鏈路行為序列。
2.根據權利要求1所述的方法,其特征在于,在獲取至少一個操作對象的日志信息之前,所述方法還包括:
對數據池中的數據進行分層,得到至少如下數據層:原始層、公共層、中間層和應用層;
按照業務類型從分層后的數據池中確定多個關鍵字段,其中,所述關鍵字段用于表征所述操作對象對應的行為數據;
根據所述關鍵字段之間的業務跳轉關系,得到所述每個行為數據之間跳轉時的關聯因子。
3.根據權利要求1所述的方法,其特征在于,在以用戶訪問操作對象過程的會話為單位,確定所述會話中包含的操作對象之前,所述方法還包括:
獲取所述用戶的基本信息,以及與所述用戶的網絡訪問行為關聯的產品信息和其他用戶的基本信息;
以所述用戶的基本信息為根節點,基于樹狀存儲結構來存儲所述產品信息和所述其他用戶的基本信息,得到所述用戶的所述用戶關系數據。
4.根據權利要求2或3所述的方法,其特征在于,還原所述樹狀存儲結構保存的所述網絡行為關系數據和所述用戶關系數據,得到多層邏輯哈希樹的結構包括:
還原所述用戶關系數據包括:將所述用戶的基本信息、所述產品信息和其他用戶的基本信息存儲至哈希樹中,且內層表單和外層表單中各自僅存儲相同類型的值。
5.根據權利要求2或3所述的方法,其特征在于,還原所述樹狀存儲結構保存的所述網絡行為關系數據和所述用戶關系數據,得到多層邏輯哈希樹的結構包括:還原所述網絡行為關系數據,其中,還原所述網絡行為關系數據包括如下至少之一:
在所述操作對象為曝光產品的情況下,將曝光產品對應的配置文件中的字段tag和解析的value值一一映射,映射結果存儲在內層表單中,并將內存表單存儲至外層表單中;
在所述行為數據為點擊操作的情況下,獲取點擊操作數據,從所述點擊操作數據中分割出獨立的點擊根節點,并基于所述點擊根節點獲取關聯的操作信息存儲至哈希樹中。
6.根據權利要求3所述的方法,其特征在于,在得到基于所述產品信息的全鏈路行為序列之后,所述方法還包括:
調用解讀工具從所述多層邏輯哈希樹的結構中獲取樣本數據,其中,所述樣本數據以key-value形式進行存儲;或者,
調用所述解讀工具讀取所述列轉行后的全鏈路行為序列。
7.根據權利要求6所述的方法,其特征在于,在獲取所述樣本數據或獲取所述全鏈路行為序列之后,所述方法還包括:
讀取所述樣本數據或所述全鏈路行為序列中的靜態數據和統計后的特征數據;
基于所述靜態數據和統計后的特征數據,生成訓練數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610730521.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





