[發明專利]數據存儲、查詢方法和裝置有效
| 申請號: | 201510053228.1 | 申請日: | 2015-01-30 |
| 公開(公告)號: | CN104574159B | 公開(公告)日: | 2018-01-23 |
| 發明(設計)人: | 金中良;曹瑞娟 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司11205 | 代理人: | 楊文娟,黃健 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 存儲 查詢 方法 裝置 | ||
技術領域
本發明實施例涉及計算機技術,尤其涉及一種數據存儲、查詢方法和裝置。
背景技術
在營銷管理系統中,一般會提供基于海量客戶屬性提取客戶群,作為營銷目標客戶。客戶屬性的存儲和查找方式,影響了提取客戶群和分析客戶群特征的效率。
在現有技術中,每個屬性集存儲于一列中,所有客戶的每個屬性分別用一個空間存儲,作為一列,稱為列式存儲。通過行號記錄行關系。類似如下:給每個時期的每個客戶分配一個序號,每個屬性有一個表格保存屬性值及對應的序號。提取客戶群或分析特征時,掃描條件列,根據指定的條件過濾。兩個以上的條件時,取多列行號的交集或并集等,得到符合條件的客戶。而在另一種行式存儲為,每個時期每個客戶的所有屬性分配一個空間存儲,作為一行。類似于每個客戶,有一個相同格式的表格,分時期記錄了客戶數據的不同屬性,例如語音用量、流量用量、短信用量等屬性。在行式存儲方式下進行數據查找時,首先需要選擇一個時期,在該時期的每個客戶的存儲空間內逐個掃描,直到找到需要的屬性取值。為避免屬性較多時,順序讀行掃描太多與查詢條件無關的屬性,有時系統會將一個客戶的屬性分到多個空間存儲,經常同時用的放在一起。考慮到可能增加的增加表關聯風險,不會分太多組。類似把300個屬性,分成3組,可從屬性所在組的開頭查找,直到找到需要的屬性值。提取客戶群時,根據條件,掃描指定的一個或幾個時期分區,根據指定的條件過濾,得到符合條件的客戶。
然而在現有技術中,列式存儲的方式中,數據的存儲是按照屬性進行存儲的,數據存儲較為龐雜,在需要查找某個時間段的數據時需要對該屬性的存儲列進行逐行掃描,在掃描過程中會出現大量無關時段數據的掃描,增加了數據輸入輸出(Input/Output,簡稱IO)的時間。行式存儲的方式中,數據的存儲是按照時期進行存儲的,在需要查找某一屬性數據時,會掃描大量無關屬性,增加IO時間。
發明內容
本發明實施例提供一種數據存儲、查詢方法和裝置,以解決現有技術中數據存儲較為龐雜,以致在掃描過程中會出現大量無關列、無關時段數據的掃描,增加了數據IO的時間的問題。
第一方面,本發明實施例提供一種數據存儲方法,其特征在于,包括:
將多個用戶的身份信息存儲于用戶身份信息屬性列文件,所述用戶身份信息屬性列文件中每一行存儲一個用戶的身份信息;
按照時間周期將所述多個用戶的使用數據分別存儲于不同的數據分區的使用數據屬性列文件中,所述使用數據屬性列文件中每一行存儲一個所述用戶的一個屬性的使用數據;
其中,所述數據分區中包括至少一個使用數據屬性列文件,各使用數據屬性列文件的每一行的存儲空間為一固定長度,每一用戶的不同屬性的使用數據分別存儲于所述數據分區中不同的使用數據屬性列文件中,所述使用數據屬性列文件的使用數據的存儲順序與所述用戶身份信息屬性列文件中用戶的身份信息的存儲順序相同。
結合第一方面,在第一方面的第一種可能的實現方式中,所述使用數據屬性列文件的使用數據的存儲順序與所述用戶身份信息屬性列文件中用戶的身份信息的存儲順序相同具體包括:
存儲所述用戶的使用數據的行對應的偏移單元格數量和存儲所述用戶的身份信息的行對應的偏移單元格數量相同。
結合第一方面,在第一方面的第二種可能的實現方式中,若所述多個用戶的至少一個屬性的使用數據包括多個不同偏好類別的使用數據,所述方法還包括:
將各用戶的所述多個不同偏好類別的使用數據依次存儲于所述屬性的偏好使用數據屬性列文件中,所述屬性的偏好使用數據屬性列文件中每一行存儲一個所述用戶的一個偏好類別的使用數據;
將各用戶的所述多個不同偏好類別的使用數據對應的偏好類別標識依次存儲于偏好類別標識屬性列文件中,并將所述多個不同偏好類別的使用數據的用戶的身份信息存儲于多維數據用戶身份屬性列文件中;
其中,所述偏好使用數據屬性列文件中偏好類別的使用數據的存儲順序與所述偏好類別標識屬性列文件中偏好類別標識的存儲順序相同,且與所述多維數據用戶身份屬性列文件中用戶的身份信息的存儲順序相同;
根據各用戶的所述多個不同偏好類別的使用數據的個數獲取所述用戶的所述多個不同偏好類別的使用數據的存儲結束位置信息,將各用戶的存儲結束位置信息存儲于存儲結束位置信息屬性列文件中,所述存儲結束位置信息屬性列文件中每一行存儲一個所述用戶的一個存儲結束位置信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510053228.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





