[發(fā)明專利]基于聚類的非一致性數(shù)據(jù)庫查詢方法在審
| 申請?zhí)枺?/td> | 201310668188.2 | 申請日: | 2013-12-11 |
| 公開(公告)號: | CN103605812A | 公開(公告)日: | 2014-02-26 |
| 發(fā)明(設(shè)計)人: | 不公告發(fā)明人 | 申請(專利權(quán))人: | 湖南人文科技學(xué)院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 417000 湖南省*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 一致性 數(shù)據(jù)庫 查詢 方法 | ||
1.一種基于聚類的非一致性數(shù)據(jù)庫查詢方法,其特征在于:具體包括:?
(1)多個關(guān)系的可信聚類概率的查詢重寫算法,詳細的步驟如下:
(1a)在給定的一個SPJ查詢中,首先得到查詢中的關(guān)系個數(shù)t和選擇條件個數(shù)k,初始化重寫查詢RJ;外循環(huán)次數(shù)為關(guān)系個數(shù),內(nèi)循環(huán)為選擇條件個數(shù);在外循環(huán)中,取得臨時變量存儲產(chǎn)生結(jié)果集的別名filter,初始化非連接合取謂詞集SCW和連接合取謂詞屬性集AJ;
(1b)在第1個內(nèi)循環(huán)中,如果合取選擇謂詞中的屬性是關(guān)系中的屬性,則判斷是否為連接的;如果為非連接合取謂詞,則把合取選擇謂詞中的屬性加入到非連接合取謂詞屬性集SCW中,否則加入到連接合取謂詞屬性集AJ中;
(1c)在第2個內(nèi)循環(huán)中,如果合取選擇謂詞中的屬性是查詢中投影屬性,把合取選擇謂詞中的屬性加入到連接合取謂詞屬性集AJ中;
(1d)在外循環(huán)的最后取得該次循環(huán)產(chǎn)生的過濾查詢RJ;連接合取謂詞屬性集SCJ等于合取謂詞屬性集減去非連接合取謂詞屬性集SCW;
(1e)通過已經(jīng)取得的產(chǎn)生過濾查詢RJ、連接合取謂詞屬性集SCJ和結(jié)果集別名filter,最終輸出查詢重寫語句;
(2)無連接聚集查詢重寫算法,具體算法的基本步驟如下:
(2a)首先對初始分組屬性G和聚類屬性cluster進行分組求聚集屬性的最大值、最小值以及期望值和,得到結(jié)果集cand;
(2b)如果同一聚類內(nèi)分組屬性值不相同,則最小值為0,因此需要去掉這種情況的元組,在產(chǎn)生的結(jié)果集cand上對初始分組屬性G進行分組求最小值和,得到包含最小值的結(jié)果集min_cand;
(2c)在結(jié)果集cand上對初始分組屬性G進行分組求最大值和期望值和,得到包含最大值和期望值的結(jié)果集max_cand;
(2d)在外查詢中,對已經(jīng)產(chǎn)生的包含最大值和期望值的結(jié)果集max_cand左連接到包含最小值的的結(jié)果集min_cand;如果連接得到最小值為空,則最小值為0;最終產(chǎn)生初始分組屬性G的最值和期望值;
?????(3)基于聚類的有連接聚集查詢重寫算法,基本步驟如下:
(3a)首先初始化重寫查詢,取得SPJ聚集查詢的關(guān)系集合R的元素個數(shù)、分組屬性集合G的元素個數(shù)、選擇謂詞集合SC的元素個數(shù)和聚集屬性集合E的元素個數(shù);
(3b)以關(guān)系集合R的元素個數(shù)為外循環(huán)次數(shù),以選擇謂詞集合SC的元素個數(shù)為內(nèi)循環(huán)次數(shù);在內(nèi)循環(huán)中,如果條件謂詞為關(guān)系的連接合取選擇謂詞,則過濾連接值不一致的聚類,取得該次循環(huán)中基于連接謂詞的查詢過濾子結(jié)果集;
(3c)然后再次以關(guān)系集合R的元素個數(shù)為外循環(huán)次數(shù),初始化結(jié)果集標記filter、分組屬性集GR、聚集值屬性集AE、非連接合取選擇謂詞集SCW和非連接合取選擇謂詞集SCJ;在第1個內(nèi)循環(huán)中,以聚集屬性集合E的元素個數(shù)為內(nèi)循環(huán)次數(shù),如果聚集值屬性在該次循環(huán)的關(guān)系中,聚集值屬性加入到聚集值屬性集AE;在第2個內(nèi)循環(huán)中,以分組屬性集合G的元素個數(shù)為內(nèi)循環(huán)次數(shù),如果分組屬性在該次循環(huán)的關(guān)系中,分組屬性加入到分組屬性集GR;第3個內(nèi)循環(huán)中,以選擇謂詞集合SC的元素個數(shù)為內(nèi)循環(huán)次數(shù),如果連接屬性在該次循環(huán)的關(guān)系中,且選擇謂詞為連接合取選擇謂詞,則選擇謂詞的連接屬性加入到分組屬性集;如果連接屬性在該次循環(huán)的關(guān)系中,且選擇謂詞為非連接合取選擇謂詞,則選擇謂詞的連接屬性加入到非連接選擇謂詞集;在外循環(huán)中,取得本次循環(huán)根據(jù)非連接選擇謂詞集和聚類存在于候選集的條件,對聚類屬性和分組屬性集分組取得概率與聚集屬性和的過濾結(jié)果集;然后連接選擇謂詞集SCJ為減去本次循環(huán)的非連接選擇謂詞;
(3d)在外查詢中,基于上一步產(chǎn)生的過濾結(jié)果集進行連接,以連接選擇謂詞為條件,對分組屬性集進行分組聚集求聚集屬性的最小值的結(jié)果集;基于初始查詢,加入聚類屬性,對聚集屬性求最大值和期望值的候選結(jié)果集;再對最大值和期望值的候選結(jié)果集左連接最小值的結(jié)果集,取得初始查詢按照分組屬性集的最大值、最小值和期望值的重寫語句。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湖南人文科技學(xué)院,未經(jīng)湖南人文科技學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310668188.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復(fù)制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設(shè)備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





