[發明專利]一種用于醫療影像數據的基于布隆過濾器的HBase索引設計方法在審
| 申請號: | 201910070748.1 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN109977113A | 公開(公告)日: | 2019-07-05 |
| 發明(設計)人: | 王丹;陳文杰;趙文兵;杜金蓮;付利華;杜曉琳;蘇航 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G16H30/20 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 劉萍 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 布隆過濾器 醫療影像數據 單獨分配 多級索引 二級索引 負載均衡 檢索數據 檢索效率 熱點問題 隨機函數 索引設計 假陽性 索引表 誤判率 減小 散列 向量 行鍵 組位 集合 抽樣 優化 改進 網絡 保證 | ||
1.一種用于醫療影像數據的基于布隆過濾器的HBase多級索引設計方法,其特征在于,包括以下步驟:
步驟1.首先將查詢請求發送給查詢服務器,HBase Coprocessor協處理器會解析這個查詢請求;
步驟2.將查詢先通過布隆過濾器過濾;
步驟3.如果通過過濾,那么再去請求索引表;索引表的具體行鍵設計為region的起始行鍵+索引名+值+主表的行鍵;
步驟4.過抽樣散列法進行Region的預分區。
2.根據權利要求1所述的用于醫療影像數據的基于布隆過濾器的HBase多級索引設計方法,其特征在于,步驟4具體如下:
步驟1:預估Region數量N;
其中RSXmx為一個RegionServer的內存大小;
habse.regionserver.global.memstore.size以及hbase.hregion.memstore.flush.size采用系統推薦的最優值,從HBase官方文檔獲取,cf是數據表的列族數,得到了Region的數量N;
步驟2:使用可逆加密算法,將主鍵散列為隨機的字符串;
步驟3:取樣,隨機取出一定數量的主鍵,然后按照升序排序將其放到一個集合里;
步驟4:根據預估的分區個數N,對整個集合平均分割,找到分裂點。
3.根據權利要求1所述的用于醫療影像數據的基于布隆過濾器的HBase多級索引設計方法,其特征在于,布隆過濾器過濾時為每一個Hash函數h i(x)使用一個獨立的位向量來進行地址映射,從而形成一個向量組V;假設有一個數據集A,x為A中的某個元素,那么向量組V的表示如下所示
其中,V(i,j)表示第i個向量中的第j位。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910070748.1/1.html,轉載請聲明來源鉆瓜專利網。





