[發明專利]數據庫分片在審
| 申請號: | 201880068665.2 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN111247518A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | C·N·小瓦倫;M·里安 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/24 |
| 代理公司: | 北京市金杜律師事務所 11256 | 代理人: | 酆迅;姚杰 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據庫 分片 | ||
1.一種用于將記錄存儲在分片數據庫的分片表中的計算機實現的方法,所述分片數據庫包括多個數據庫分片,所述多個數據庫分片中的每個數據庫分片被配置為存儲所述分片表的記錄的子集并且與相應的布隆過濾器相關聯,所述布隆過濾器被配置為提供關于與特定分片關鍵字相關聯的記錄是否已經被存儲在所述數據庫分片中的指示,所述計算機實現的方法包括:
獲得要被存儲的所述記錄的分片關鍵字,所述分片關鍵字基于所述記錄的一個或多個字段;
針對多個相應布隆過濾器中的每一個布隆過濾器,通過將所述布隆過濾器所使用的一個或多個散列函數應用于所述分片關鍵字來生成與所述布隆過濾器一起使用的所述分片關鍵字的相應表示;
計算所述多個布隆過濾器中的每一個布隆過濾器的當前值和與所述布隆過濾器一起使用的所述分片關鍵字的所述相應表示之間的漢明距離;
基于所計算的漢明距離來選擇數據庫分片;以及
將所述記錄存儲在所選擇的數據庫分片中。
2.根據權利要求1所述的計算機實現的方法,其中所述相應布隆過濾器中的每一個布隆過濾器使用相同數量的比特和相同的散列函數。
3.根據權利要求1所述的計算機實現的方法,其中所述相應布隆過濾器中的每一個布隆過濾器是計數過濾器。
4.根據權利要求1所述的計算機實現的方法,其中選擇數據庫分片包括選擇與所計算的漢明距離是所計算的漢明距離之中的最小值的相應布隆過濾器相關聯的數據庫分片。
5.根據權利要求4所述的計算機實現的方法,其中選擇與所計算的漢明距離是所計算的漢明距離之中的最小值的相應布隆過濾器相關聯的數據庫分片,包括從與所計算的漢明距離是最小值的相應布隆過濾器相關聯的那些數據庫分片之中隨機選擇所述數據庫分片。
6.根據權利要求1所述的計算機實現的方法,其中所述分片數據庫還包括每個數據庫分片可用于存儲新記錄或者不可用于存儲新記錄的指示,并且其中為其生成所述分片關鍵字的相應表示的所述多個布隆過濾器不包括與被指示為不可用的數據庫分片相關聯的任何布隆過濾器。
7.根據權利要求6所述的計算機實現的方法,其中為其生成所述分片關鍵字的表示的所述多個布隆過濾器包括與被指示為可用的所有所述數據庫分片相關聯的相應布隆過濾器。
8.根據權利要求1所述的計算機實現的方法,其中所述分片數據庫還包括用于對已經插入到所述數據庫分片中的每個數據庫分片中的記錄的相應數量進行計數的相應插入計數器,并且其中所述計算機實現的方法還包括:
針對所選擇的數據庫分片遞增所述插入計數器。
9.根據權利要求8所述的計算機實現的方法,其中所述計算機實現的方法還包括:
確定已被插入到所選擇的數據庫分片中的記錄的數量是否超過預定閾值;以及
響應于確定已被插入到所選擇的數據庫分片中的所述記錄的數量超過所述預定閾值,將所選擇的數據庫分片標記為不可用于存儲新記錄。
10.根據權利要求1所述的計算機實現的方法,其中所述計算機實現的方法還包括:
將新數據庫分片和相關聯的布隆過濾器添加到所述分片數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880068665.2/1.html,轉載請聲明來源鉆瓜專利網。





