[發(fā)明專利]海量大數(shù)據(jù)檢索方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201910441720.4 | 申請日: | 2019-05-24 |
| 公開(公告)號: | CN110162528A | 公開(公告)日: | 2019-08-23 |
| 發(fā)明(設(shè)計)人: | 陸夏根;楊子江;于俊鳳;李思思;徐蓓蓓;魏墨濟(jì);楊愛芹 | 申請(專利權(quán))人: | 安徽芃睿科技有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2455;G06F16/182 |
| 代理公司: | 濟(jì)南圣達(dá)知識產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 張慶騫 |
| 地址: | 230000 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 檢索條件 索引表 大數(shù)據(jù) 檢索 訪問頻度 查詢 持久化存儲 查詢結(jié)果 索引內(nèi)存 輸出 緩存層 預(yù)設(shè) 索引 | ||
1.一種海量大數(shù)據(jù)檢索方法,其特征在于,包括:
在索引內(nèi)存緩存層的熱點(diǎn)索引表中查詢符合檢索條件的數(shù)據(jù);所述熱點(diǎn)索引表中存在有訪問頻度不小于預(yù)設(shè)訪問頻度閾值的數(shù)據(jù);
當(dāng)熱點(diǎn)索引表中存在符合檢索條件的數(shù)據(jù)時,則直接輸出查詢到的數(shù)據(jù);
當(dāng)熱點(diǎn)索引表中不存在符合檢索條件的數(shù)據(jù)時,則轉(zhuǎn)到索引持久化存儲層繼續(xù)查詢符合檢索條件的數(shù)據(jù),輸出查詢結(jié)果。
2.如權(quán)利要求1所述的一種海量大數(shù)據(jù)檢索方法,其特征在于,所述索引持久化存儲層中持久化存儲有HBase,所述HBase中存儲有多個非主鍵屬性索引表,每個非主鍵屬性索引表用來對應(yīng)存儲管理用戶表中的一個待查詢非主鍵屬性的索引;
或所述索引內(nèi)存緩存層為分布式內(nèi)存緩存,使用一致性哈希來確定數(shù)據(jù)所在的服務(wù)器節(jié)點(diǎn);在節(jié)點(diǎn)發(fā)生變化時,只有和變化節(jié)點(diǎn)相鄰的節(jié)點(diǎn)數(shù)據(jù)需要遷移。
3.如權(quán)利要求1所述的一種海量大數(shù)據(jù)檢索方法,其特征在于,在索引內(nèi)存緩存層中執(zhí)行查詢請求時,內(nèi)存緩存的服務(wù)進(jìn)程對訪問到的每條索引數(shù)據(jù)記錄本周期內(nèi)的訪問次數(shù),直到查詢請求次數(shù)達(dá)到預(yù)設(shè)訪問次數(shù)閾值,即到達(dá)熱度計算周期時,服務(wù)進(jìn)程觸發(fā)緩存的更新替換。
4.如權(quán)利要求3所述的一種海量大數(shù)據(jù)檢索方法,其特征在于,根據(jù)索引集合在相應(yīng)周期內(nèi)的被訪問次數(shù)計算所有記錄的熱度,根據(jù)熱度排序,將熱度排序位于前K位的集合記錄緩存到內(nèi)存中;其中,K為熱度門限值;根據(jù)緩存空間能夠容納的記錄條數(shù)限制計算出熱度門限K,高于熱度門限的集合被緩存到內(nèi)存中。
5.一種海量大數(shù)據(jù)檢索系統(tǒng),其特征在于,包括:
第一查詢模塊,其用于在索引內(nèi)存緩存層的熱點(diǎn)索引表中查詢符合檢索條件的數(shù)據(jù);所述熱點(diǎn)索引表中存在有訪問頻度不小于預(yù)設(shè)訪問頻度閾值的數(shù)據(jù);
當(dāng)熱點(diǎn)索引表中存在符合檢索條件的數(shù)據(jù)時,則直接輸出查詢到的數(shù)據(jù);
第二查詢模塊,其用于當(dāng)熱點(diǎn)索引表中不存在符合檢索條件的數(shù)據(jù)時,則轉(zhuǎn)到索引持久化存儲層繼續(xù)查詢符合檢索條件的數(shù)據(jù),輸出查詢結(jié)果。
6.如權(quán)利要求5所述的一種海量大數(shù)據(jù)檢索系統(tǒng),其特征在于,在所述第二查詢模塊中,所述索引持久化存儲層中持久化存儲有HBase,所述HBase中存儲有多個非主鍵屬性索引表,每個非主鍵屬性索引表用來對應(yīng)存儲管理用戶表中的一個待查詢非主鍵屬性的索引;
或在所述第二查詢模塊中,所述索引內(nèi)存緩存層為分布式內(nèi)存緩存,使用一致性哈希來確定數(shù)據(jù)所在的服務(wù)器節(jié)點(diǎn);在節(jié)點(diǎn)發(fā)生變化時,只有和變化節(jié)點(diǎn)相鄰的節(jié)點(diǎn)數(shù)據(jù)需要遷移。
7.如權(quán)利要求5所述的一種海量大數(shù)據(jù)檢索系統(tǒng),其特征在于,在所述第一查詢模塊中,在索引內(nèi)存緩存層中執(zhí)行查詢請求時,內(nèi)存緩存的服務(wù)進(jìn)程對訪問到的每條索引數(shù)據(jù)記錄本周期內(nèi)的訪問次數(shù),直到查詢請求次數(shù)達(dá)到預(yù)設(shè)訪問次數(shù)閾值,即到達(dá)熱度計算周期時,服務(wù)進(jìn)程觸發(fā)緩存的更新替換。
8.如權(quán)利要求7所述的一種海量大數(shù)據(jù)檢索系統(tǒng),其特征在于,在所述第一查詢模塊中,根據(jù)索引集合在相應(yīng)周期內(nèi)的被訪問次數(shù)計算所有記錄的熱度,根據(jù)熱度排序,將熱度排序位于前K位的集合記錄緩存到內(nèi)存中;其中,K為熱度門限值;根據(jù)緩存空間能夠容納的記錄條數(shù)限制計算出熱度門限K,高于熱度門限的集合被緩存到內(nèi)存中。
9.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1-4中任一項所述的海量大數(shù)據(jù)檢索方法中的步驟。
10.一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時實(shí)現(xiàn)如權(quán)利要求1-4中任一項所述的海量大數(shù)據(jù)檢索方法中的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽芃??萍加邢薰?,未經(jīng)安徽芃睿科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910441720.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于大數(shù)據(jù)平臺的網(wǎng)絡(luò)安全實(shí)施系統(tǒng)及方法
- 基于事件驅(qū)動的智慧城市大數(shù)據(jù)體系及處理方法
- 一種大數(shù)據(jù)應(yīng)用開發(fā)的系統(tǒng)及方法
- 家用設(shè)備報告的生成方法、大數(shù)據(jù)系統(tǒng)和存儲介質(zhì)
- 一種基于計算機(jī)大數(shù)據(jù)的平臺架構(gòu)
- 一種大數(shù)據(jù)處理系統(tǒng)
- 面向工業(yè)4.0的時空大數(shù)據(jù)分布式存儲檢索方法及系統(tǒng)
- 一種聯(lián)網(wǎng)式醫(yī)療大數(shù)據(jù)分級傳輸方法及系統(tǒng)
- 一種大數(shù)據(jù)信息監(jiān)控方法、裝置及計算機(jī)設(shè)備
- 一種知識產(chǎn)權(quán)大數(shù)據(jù)情報檢索系統(tǒng)





