[發明專利]一種數據導入HBase數據庫的方法和裝置有效
| 申請號: | 201410346370.0 | 申請日: | 2014-07-21 |
| 公開(公告)號: | CN104077420B | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 李勇 | 申請(專利權)人: | 北京京東尚科信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京德琦知識產權代理有限公司11018 | 代理人: | 張馳,宋志強 |
| 地址: | 100080 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據 導入 hbase 數據庫 方法 裝置 | ||
1.一種數據導入HBase數據庫的方法,其特征在于,該方法包括:
利用輸入輸出IO流方式將各種類型的輸入源數據整合為字符串,讀取所述輸入輸出流以獲取預定緩沖區大小的字符串;
將所讀取的字符串轉換為Put對象,根據所述Put對象的行主鍵確定該Put對象所屬的區域服務器;從多張Put對象列表中確定所述Put對象被寫入的選中Put對象列表,以在各個Put對象列表中都均勻分布有多個區域服務器,其中每張Put對象列表中分別包含有待存儲Put對象與所屬區域服務器之間的對應關系;
針對每個Put對象列表分別啟動寫任務,以將所述Put對象列表中待存儲Put對象所對應的數據導入所述待存儲Put對象所屬的區域服務器。
2.根據權利要求1所述的數據導入HBase數據庫的方法,其特征在于,所述利用IO流方式將各種類型的輸入源數據整合為字符串包括下列中的至少一個:
利用IO流方式將文本文件數據整合為字符串;
利用IO流方式將Hadoop分布式文件系統文件整合為字符串;
利用IO流方式將網絡源數據整合為字符串。
3.根據權利要求1所述的數據導入HBase數據庫的方法,其特征在于,所述讀取所述IO流以獲取預定緩沖區大小的字符串包括:
采用while循環的方式讀取所述IO流以獲取預定緩沖區大小的字符串;該方法還包括:當所述while循環終止后,關閉所述IO流。
4.根據權利要求1所述的數據導入HBase數據庫的方法,其特征在于,在將所讀取的字符串轉換為Put對象之前,該方法進一步包括:驗證所讀取的字符串是否符合預先設定的業務預期,如果是,則開始將所讀取的字符串轉換為Put對象;如果不是,則退出本流程。
5.根據權利要求1所述的數據導入HBase數據庫的方法,其特征在于,所述針對每個Put對象列表分別啟動寫任務,以將Put對象列表中待存儲Put對象所對應的數據導入所述待存儲Put對象所屬的區域服務器包括:
當Put對象列表中待存儲Put對象數目達到預先設置的門限值時,啟動對應于該Put對象列表的單獨寫任務,在單獨寫任務中處理所述Put對象列表,以將所述Put對象列表中待存儲Put對象所對應的數據導入所述待存儲Put對象所屬的區域服務器,其中通過線程池維護各個Put對象列表的各自單獨寫任務。
6.根據權利要求1所述的數據導入HBase數據庫的方法,其特征在于,該方法進一步包括:在出現異常時,執行下列操作中的至少一個:打印異常日志;發送報警郵件;發送報警短信。
7.一種數據導入HBase數據庫的裝置,其特征在于,包括輸入流處理模塊、數據處理模塊和批量寫HBase模塊,其中:
輸入流處理模塊,用于利用輸入輸出IO流方式將各種類型的輸入源數據整合為字符串,讀取所述輸入輸出流以獲取預定緩沖區大小的字符串;
數據處理模塊,用于將所讀取的字符串轉換為Put對象,根據所述Put對象的行主鍵確定該Put對象所屬的區域服務器;從多張Put對象列表中確定所述Put對象被寫入的選中Put對象列表,以在各個Put對象列表中都均勻分布有多個區域服務器,其中每張Put對象列表中分別包含有待存儲Put對象與所屬區域服務器之間的對應關系;
批量寫HBase模塊,用于針對每個Put對象列表分別啟動寫任務,以將所述Put對象列表中待存儲Put對象所對應的數據導入所述待存儲Put對象所屬的區域服務器。
8.根據權利要求7所述的數據導入HBase數據庫的裝置,其特征在于,輸入流處理模塊,用于處理下列中的至少一個:
利用IO流方式將文本文件數據整合為字符串;
利用IO流方式將Hadoop分布式文件系統文件整合為字符串;
利用IO流方式將網絡源數據整合為字符串。
9.根據權利要求7所述的數據導入HBase數據庫的裝置,其特征在于,
輸入流處理模塊,用于采用while循環的方式讀取所述IO流以獲取預定緩沖區大小的字符串;還包括:當所述while循環終止后,關閉所述IO流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司,未經北京京東尚科信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410346370.0/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





