[發明專利]一種基于封閉外殼片段立方體的水利普查數據挖掘方法在審
| 申請號: | 201811275645.0 | 申請日: | 2018-10-30 |
| 公開(公告)號: | CN109408514A | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | 萬定生;趙群;朱躍龍;周金玉;阮祥超;石波;唐珊珊 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/28;G06F16/2458 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 211100 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 封閉外殼 查詢 倒排索引 高維數據 基本單元 數據挖掘 低維 封閉 查找 查詢結果 查詢效率 存儲結構 封閉單元 快速定位 快速判斷 數據單元 位圖索引 封閉性 水利 存儲 集合 壓縮 重復 保留 保證 | ||
1.一種基于封閉外殼片段立方體的水利普查數據挖掘方法,其特征在于,包括以下步驟:
1)生成封閉外殼片段立方體,具體為:
11)基于外殼片段立方體方法劃分維片段,即將非層次維度屬性的高維數據按照維度屬性互不相交的原則劃分為大小為F的k個低維數據片段;
12)依次對低維數據片段進行編號FID,基于基本事實表創建每個低維數據片段對應的維度屬性值對照表和度量索引對照表,所述維度屬性值對照表包括索引號TID以及對應的維度屬性值,所述度量索引對照表包括索引號TID以及對應的度量屬性值;
13)基于基本事實表構造每個維度屬性值的倒排索引表;
14)對于非層次維度屬性的高維數據的每條基本單元,均按照維度屬性值對照表劃分為k個低維數據基本單元,對任一低維數據片段,相應地生成每條低維數據基本單元各查詢位圖對應的倒排索引TID-List,同時進行查詢位圖的封閉性行判斷;在當前的低維數據片段中,所有低維數據基本單元的各查詢位圖對應的倒排索引TID-List均生成后進行查詢位圖的封閉性列判斷;僅保留封閉查詢位圖及對應的倒排索引TID-List,生成當前低維數據片段的低維數據基本單元-查詢位圖-倒排索引對照表,即為當前低維數據片段對應的封閉外殼片段;重復14)直至生成所有低維數據片段對應的封閉外殼片段;
15)按照各個低維數據片段的低維數據基本單元-查詢位圖-倒排索引對照表存儲結構輸出各個低維數據片段對應的封閉外殼片段;
2)查詢封閉外殼片段立方體,具體為:
21)對于查詢Q=<d1,…,di,…,dn>(1<i<n),根據維度屬性值對照表將查詢Q按照編號FID劃分為大小為F的k個子查詢{<d1,…,dF>,…<di,…,dF+i>,…},即每個子查詢均對應維度屬性值對照表的編號FID,其中di表示當前查詢中第i維的維度屬性值;
22)任一子查詢<di,…,dF+i>,對應的查詢位圖Query-Bitmap=<B1,…,BF>,在對應編號FID的各個低維數據片段對應的封閉外殼片段的低維數據基本單元-查詢位圖-倒排索引對照表中,查詢第一條匹配<di,…,dF+i>的低維數據基本單元以及對應的封閉查詢位圖;
23)基于步驟22)得到的低維數據基本單元,查找對應的封閉查詢位圖中以F位為一個匹配單元,查找匹配<B1,…,BF>的查詢位圖,得到對應的倒排索引TID-List即為對應編號FID的低維數據片段的查詢結果;
24)重復步驟22)和步驟23)直至得到所有低維數據片段的查詢結果,對各個低維數據片段的查詢結果求交集,根據度量索引對照表和給定的聚集函數計算出查詢結果即為查詢Q=<d1,…,di,…,dn>的結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811275645.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據處理方法、系統以及存儲介質
- 下一篇:一種索引執行方法與裝置





