[發明專利]一種避免Hbase數據熱點的方法及系統有效
| 申請號: | 201610024940.3 | 申請日: | 2016-01-14 |
| 公開(公告)號: | CN105681414B | 公開(公告)日: | 2019-01-01 |
| 發明(設計)人: | 雷果;葉春生;車新奕;程濤木;王敏;劉軍徽 | 申請(專利權)人: | 深圳市博瑞得科技有限公司 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08 |
| 代理公司: | 深圳市恒申知識產權事務所(普通合伙) 44312 | 代理人: | 王利彬 |
| 地址: | 518057 廣東省深圳市南山區高新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 避免 hbase 數據 熱點 方法 系統 | ||
本發明適用于數據存儲,提供了一種避免Hbase數據熱點的方法,步驟包括:A,讀取待存儲數據,根據需要選取字段內容作為初始主鍵,然后用散列算法對初始主鍵進行處理得到主鍵值,對主鍵值進行均勻分段得到若干主鍵段;B,根據若干主鍵段確定用于分配主鍵段的若干區域,然后將若干主鍵段均勻分配至若干區域中;C,將得到的若干區域均勻分配至每一區域服務器中。本發明將Hbase的整個存儲模式綜合考慮,不僅僅要考慮Region的數量,更需要綜合考慮Region的大小,相比現有的其他基于Hbase的避免熱點的方法,本發明效果更為顯著,對于Hbase的使用性能提升較大,大大提升了Hbase對大數據的處理存儲能力,從根本上避免了Hbase數據熱點的問題。
技術領域
本發明屬于數據存儲領域,尤其涉及一種新型的避免Hbase數據熱點的方法及系統。
背景技術
隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。大數據時代網民和消費者的界限正在消弭,企業的疆界變得模糊,數據成為核心的資產,并將深刻影響企業的業務模式,甚至重構其文化和組織。因此,大數據對國家治理模式、對企業的決策、組織和業務流程、對個人生活方式都將產生巨大的影響。如何利用大數據更加貼近消費者、深刻理解需求、高效分析信息并作出預判,是決定我們能否有效利用大數據這座“金礦”的重要基礎。然而面對這種海量數據、高并發訪問的情況,數據庫能提供穩定、可靠的性能則是至關重要的。但傳統的數據庫的處理能力以及處理效率已經遠遠不能滿足這種大數據的處理需求。
在這種技術背景下,面向大數據分析分布式的數據庫應運而生。Hbase是Hadoop上的一個NoSQL數據庫的實現,同時也是一個分布式的、面向列的開源數據庫。它提供了強大的可擴展性和數據操作性能。
在Hbase中,僅能通過主鍵(rowkey)和主鍵的range(范圍)來檢索數據,僅支持單行事務,主要用來存儲非結構化和半結構化的松散數據。
Hbase的數據存儲模式如下:
1、Table(表)中的所有行都按照rowkey的字典序排列。
2、Table在行的方向上將rowkey分割為多段,每個Region(區域)即承載多段rowkey數據。
3、Region按大小分割的,每個表一開始只有一個Region,隨著數據不斷插入表,Region不斷增大,當增大到一個閥值的時候,Region就會等分為兩個新的Region。當table中的行不斷增多,就會有越來越多的Region。
4、Region是Hbase中分布式存儲和負載均衡的最小單元。最小單元就表示不同的Region可以分布在不同的Region Server(區域服務器)上。但同一個Region是不會拆分到多個server(服務器)上的。在Hbase中由Master(主機)負責分配Region到各個不同的Region Server上,Region Server負責存儲實際的數據。但如果Region Server上的負載不均衡或者每個Region Server中的服務請求數量不均衡,這些都將影響HBase的服務性能。
因此,如何避免Hbase數據熱點策略不僅僅與Region Server的負載均衡有關,還與rowkey合理分段有關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市博瑞得科技有限公司,未經深圳市博瑞得科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610024940.3/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





