[發明專利]一種非關系型數據庫動態混合索引方法有效
| 申請號: | 201910327502.8 | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110069500B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 章昭輝;蔣昌俊;王鵬偉;張曉波 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/245;G06F16/2458 |
| 代理公司: | 上海申匯專利代理有限公司 31001 | 代理人: | 翁若瑩;柏子雵 |
| 地址: | 201600 上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關系 數據庫 動態 混合 索引 方法 | ||
1.一種非關系型數據庫動態混合索引方法,其特征在于,包括以下步驟:
(1)定義非主鍵字段的權重,通過一個周期內字段作為查詢條件的頻次以及字段的歷史權重,更新非主鍵字段的權重值,更新第i個非主鍵字段的權重值包括以下步驟:
S101、統計查詢次數
周期性統計周期內查詢次數tc以及以第i個非主鍵字段作為查詢條件的查詢次數vci;
S102、計算概率值
計算出第i個非主鍵字段周期內的作為查詢條件的概率值p(ci):
S103、計算周期內權重
結合其他字段的查詢情況,計算出當前周期內第i個非主鍵字段的權重值ω(i):
S104、計算新權重
結合第i個非主鍵字段的第n-1個周期結束后的歷史權重值,計算出第i個非主鍵字段的第n個周期的新權重值
式中,ρ表示衰減系數,代表了每過一個查詢周期字段權重衰減的快慢程度,取值范圍為[0,1];
S105返回新的權重值;
(2)動態劃分索引類型
非主鍵字段的權重值定期更新的同時,更新非主鍵字段的索引類型,根據非主鍵字段的權重值,將非主鍵字段的索引類型劃分為兩類:高頻字段和低頻字段,包括以下步驟:
S201獲取非主鍵字段權重
在第n個周期結束后,獲取所有非主鍵字段的權重值并將權重值按序排列,排完序后作為計算的輸入數據;
S202、設定一個閾值k;
S203、分離字段
將所有非主鍵字段分為兩個集合,集合C0和集合C1,集合C0內的非主鍵字段的權重值小于閾值k,集合C1內的非主鍵字段的權重值大于等于閾值k;
S204、計算字段占比
計算集合C0和集合C1的字段占比ω0及ω1,ω0+ω1=1,且有:
式中,Si代表i個非主鍵字段的權重值;
S205、計算均值
計算集合C0中的非主鍵字段的權重均值μ0、集合C1中的非主鍵字段的權重均值μ1、所有非主鍵字段的權重均值μT:
S206、計算方差
通過均值計算集合C0和集合C1兩個部分之間的權重方差δ2(k):
δ2(k)=ω0(μ0-μT)+ω1(μ1-μT)
S207、重新設定一個閾值k后返回步驟S203,直至遍歷閾值k的所有可能值,進入步驟S208;
S208得到最終閾值
將權重方差δ2(k)最大時對應的閾值為最終閾值;
S209、將權重值大于閾值的非主鍵字段劃分為高頻字段,反之劃分為低頻字段;
(3)進行混合索引,建立鍵值對非關系型數據庫的非主鍵索引結構
針對高頻字段建立詳細索引以支持快速查詢,對于低頻字段建立摘要索引。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910327502.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據管理方法、裝置、系統及存儲介質
- 下一篇:一種大數據儲存系統





