[發明專利]一種基于大數據的分布式非結構化數據庫關聯查詢方法在審
| 申請號: | 202010738074.0 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111930817A | 公開(公告)日: | 2020-11-13 |
| 發明(設計)人: | 劉躍紅;曹浩;曾國江;郭倩 | 申請(專利權)人: | 銀盛支付服務股份有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/215;G06F16/27 |
| 代理公司: | 深圳市深可信專利代理有限公司 44599 | 代理人: | 彭光榮 |
| 地址: | 518000 廣東省深圳市龍華*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 分布式 結構 數據庫 關聯 查詢 方法 | ||
本發明公開了一種基于大數據的分布式非結構化數據庫關聯查詢方法,涉及數據處理技術領域;該方法包括以下的步驟:S1、數據表的生成,結合業務需求,采用mapping設計多表關聯的數據表實例,以獲得多張數據表;S2、數據表監控;S3、數據同步;S4、ETL處理及數據聚合,通過kafka集群,對步驟S3中經過數據同步的數據進行清洗及預處理,并聚合后落地存儲至非結構化數據庫中;S5、分片算法的選擇,當數據達到Tb級別數據量時,通過結合查詢場景設計分片算法,實現數據的分布式海量存儲;本發明的有益效果是:可實現結構化數據庫與非結構化數據庫的讀寫分離,解決海量數據存儲問題。
技術領域
本發明涉及數據處理技術領域,更具體的說,本發明涉及一種基于大數據的分布式非結構化數據庫關聯查詢方法。
背景技術
關系數據庫,是建立在關系模型基礎上的數據庫,借助于集合代數等數學概念和方法來處理數據庫中的數據。現實世界中的各種實體以及實體之間的各種聯系均用關系模型來表示。標準數據查詢語言SQL就是一種基于關系數據庫的語言,這種語言執行對關系數據庫中數據的檢索和操作。關系模型由關系數據結構、關系操作集合、關系完整性約束三部分組成。
傳統關系型數據庫,涉及表與表之間的關聯查詢,可通過視圖實現。但隨著業務的快速增長,關系型數據庫的瓶頸逐漸凸顯,如:(1)數據量急劇增加,查詢性能瓶頸嚴重;(2)傳統關系型數據庫查詢瓶頸影響交易過程中的寫入性能,急需考慮讀寫分離;(3)傳統關系型數據庫難以解決海量數據存儲問題。
發明內容
為了克服現有技術的不足,本發明提供一種基于大數據的分布式非結構化數據庫關聯查詢方法,該方法可實現結構化數據庫與非結構化數據庫的讀寫分離,解決海量數據存儲問題。
本發明解決其技術問題所采用的技術方案是:一種基于大數據的分布式非結構化數據庫關聯查詢方法,其改進之處在于,該方法包括以下的步驟:
S1、數據表的生成,結合業務需求,采用mapping設計多表關聯的數據表實例,以獲得多張數據表;
S2、數據表監控,通過Ogg監控各數據表變化,以適應業務數據的實時變化;
S3、數據同步,利用Ogg同步原理,實現Oracle數據庫與kafka集群中多表增量數據的實時同步;
S4、ETL處理及數據聚合,通過kafka集群,對步驟S3中經過數據同步的數據進行清洗及預處理,并聚合后落地存儲至非結構化數據庫中;
S5、分片算法的選擇,當數據達到Tb級別數據量時,通過結合查詢場景設計分片算法,實現數據的分布式海量存儲。
進一步的,在所述的步驟S1中,所述的業務需求包括但不限于支付領域中的掃碼預授權、聚合碼、直連以及間聯業務。
進一步的,在所述的步驟S1中:
在mapping設計多表關聯的表實例時,需設計源端至目標端的落地規則,實現非結構化數據庫關聯查詢表的實現原型。
進一步的,所述的落地規則包括但不限于分布式數據據庫的數據分片鍵的設計和預先設置頻繁查詢的索引。
進一步的,所述的步驟S5中,所述的查詢場景包括但不限于:
第一場景,數據寫入頻繁且讀取較少的場景,具體是指,寫入的數據有1000萬條以上,且讀取的數據有1-2萬條;
第二場景,數據讀取頻繁且寫入較少的場景,具體是指,寫入的數據有1-2萬條,且讀取的數據有1000萬條以上。
進一步的,對于第一場景,采用hash分片算法,將指定的key hash散列分布在不同的集群節點上,在數據落地時將數據做到了平衡,提升寫入性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于銀盛支付服務股份有限公司,未經銀盛支付服務股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010738074.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





