[發明專利]數據實時存儲方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202010090231.1 | 申請日: | 2020-02-13 |
| 公開(公告)號: | CN111400361A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 饒鑫;黃望;石曉龍 | 申請(專利權)人: | 中國平安人壽保險股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06F16/28;G06F16/25 |
| 代理公司: | 深圳市世聯合知識產權代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 廣東省深圳市福田區益田路5033號*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 實時 存儲 方法 裝置 計算機 設備 介質 | ||
1.一種數據實時存儲方法,其特征在于,包括:
讀取預設配置文件得到日志篩選條件,從采集到的日志數據中獲取符合所述日志篩選條件的日志數據,并根據所述預設配置文件將獲取到的日志數據寫入kafka中,作為待轉化數據;
定時從kafka中讀取所述待轉化數據,根據預設切片條件對讀取到的所述待轉化數據進行切割匹配處理得到待確定文本序列,并將所述待確定文本序列寫入hbase上的預設數據表中;
根據所述預設數據表在所述hbase上的存儲路徑為hive生成指向所述預設數據庫表的結構數據軟鏈接;
通過正則表達式對根據所述結構數據軟鏈接獲取到的所述待確定文本序列進行切割處理,并將切割處理后得到的結構化數據寫入所述hive上的結構化數據庫中。
2.根據權利要求1所述的方法,其特征在于,所述根據預設切片條件對讀取到的所述待轉化數據進行切割匹配處理得到待確定文本序列,包括:
根據所述預設切片條件確定所述待轉化數據的切片點;
定位所述切片點在所述待轉化數據中的位置坐標,并根據所述位置坐標將所述待轉化數據切割為字符串序列;
根據預設匹配條件獲取與所述字符串序列對應的鍵值文本序列并進行關聯,得到待確定文本。
3.根據權利要求2所述的方法,其特征在于,所述根據所述預設切片條件確定所述待轉化數據的切片點,包括:
將每一個字符串在同一行所述待轉化數據中的出現頻次作為頻次數組,并計算所述頻次數組的方差;
若所述頻次數組的方差小于特定數值,則將所述字符串作為所述切片點。
4.根據權利要求2所述的方法,其特征在于,所述根據所述預設切片條件確定所述待轉化數據的切片點,包括:
將所述待轉化數據中出現頻次最多的字符串作為所述切片點。
5.根據權利要求2所述的方法,其特征在于,所述根據預設匹配條件獲取與所述字符串序列對應的所述鍵值文本序列并進行關聯,包括:
獲取所述字符串序列的鍵值文本序列以及所述鍵值文本序列的標識符;
將與所述標識符對應的所述字符串序列賦值給所述鍵值文本序列。
6.根據權利要求1所述的方法,其特征在于,所述從采集到的日志數據中獲取符合所述日志篩選條件的日志數據,并根據所述預設配置文件將獲取到的日志數據寫入kafka中,包括:
從采集到的所述日志數據中獲取格式關鍵字,并按照所述格式關鍵字對所述日志數據進行歸類,得到歸類日志數據;
從所述歸類日志數據中獲取符合所述日志篩選條件的日志數據,作為待寫入數據,并根據所述待寫入數據的采集路徑將所述待寫入數據寫入kafka中。
7.根據權利要求1所述的方法,其特征在于,所述通過正則表達式對根據所述結構數據軟鏈接獲取到的所述待確定文本序列進行切割處理,包括:
將從所述待確定文本序列中搜索到的指定字符替換為預設切割字符,并在所述預設切割字符處對所述待確定文本序列進行切割。
8.一種數據實時存儲裝置,其特征在于,包括:
數據緩沖模塊,用于讀取預設配置文件得到日志篩選條件,從采集到的日志數據中獲取符合所述日志篩選條件的日志數據,并根據所述預設配置文件將獲取到的日志數據寫入kafka中,作為待轉化數據;
序列匹配模塊,用于定時從kafka中讀取所述待轉化數據,根據預設切片條件對讀取到的所述待轉化數據進行切割匹配處理得到待確定文本序列,并將所述待確定文本序列寫入hbase上的預設數據表中;
鏈接指向模塊,用于根據所述預設數據表在所述hbase上的存儲路徑為hive生成指向所述預設數據庫表的結構數據軟鏈接;
結構化模塊,用于通過正則表達式對根據所述結構數據軟鏈接獲取到的所述待確定文本序列進行切割處理,并將切割處理后得到的結構化數據寫入所述hive上的結構化數據庫中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國平安人壽保險股份有限公司,未經中國平安人壽保險股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010090231.1/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





