[發(fā)明專(zhuān)利]一種基于查詢計(jì)劃的聯(lián)邦型RDF系統(tǒng)Top-K查詢與優(yōu)化方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010977090.5 | 申請(qǐng)日: | 2020-09-17 |
| 公開(kāi)(公告)號(hào): | CN112100209B | 公開(kāi)(公告)日: | 2022-09-27 |
| 發(fā)明(設(shè)計(jì))人: | 葛寧超;彭鵬;秦拯;李明道;王青;張吉昕 | 申請(qǐng)(專(zhuān)利權(quán))人: | 湖南大學(xué) |
| 主分類(lèi)號(hào): | G06F16/2453 | 分類(lèi)號(hào): | G06F16/2453;G06F16/27 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 410082 湖南省*** | 國(guó)省代碼: | 湖南;43 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 查詢 計(jì)劃 聯(lián)邦 rdf 系統(tǒng) top 優(yōu)化 方法 | ||
1.一種基于查詢計(jì)劃的聯(lián)邦型RDF系統(tǒng)Top-K查詢與優(yōu)化方法,其主要特征是:
(1)基于同源歸并的查詢分解與數(shù)據(jù)源定位方法
定義集合D={D1,D2,D3,...,Dn}表示一個(gè)聯(lián)邦型RDF系統(tǒng)有n個(gè)RDF數(shù)據(jù)源,對(duì)于每個(gè)RDF數(shù)據(jù)源Di離線提取其所有謂詞m個(gè),形成謂詞集合P(Di)={P1,P2,P3,...,Pm},不同的RDF數(shù)據(jù)源的謂詞集合之間可能存在交集,因此對(duì)于一個(gè)謂詞可能有多個(gè)RDF數(shù)據(jù)源;定義一個(gè)Hash映射集合HP,S存儲(chǔ)聯(lián)邦型RDF系統(tǒng)中所有關(guān)系謂詞及其對(duì)應(yīng)的RDF數(shù)據(jù)源集合,其中每一個(gè)映射元素Pk,S表示一個(gè)謂詞Pk的RDF數(shù)據(jù)源為集合S;
對(duì)于兩個(gè)不同的謂詞Pi和Pj,當(dāng)它們的RDF數(shù)據(jù)源H(Pi)=H(Pj)時(shí):①RDF數(shù)據(jù)源個(gè)數(shù)|H(Pi)|=1;②RDF數(shù)據(jù)源個(gè)數(shù)|H(Pi)|>1,且RS(P)表示包含謂詞P的所有三元組主體集合,RO(P)表示包含謂詞P的所有三元組客體集合,則表示包含謂詞Pi和Pj的兩個(gè)三元組可以合并為一個(gè)子查詢,該子查詢的RDF數(shù)據(jù)源為H(Pi);
(2)基于代價(jià)模型和動(dòng)態(tài)規(guī)劃的最優(yōu)查詢計(jì)劃生成方法
對(duì)于聯(lián)邦型RDF數(shù)據(jù)系統(tǒng)中任意一個(gè)謂詞Pi,定義包含該謂詞的三元組總個(gè)數(shù)為Sum(Pi)=card(σP=Pi(D));包含該謂詞的三元組中不同的主體個(gè)數(shù)為Subject(Pi)=card(dom[πS(σp=pi(D))]);包含該謂詞的三元組中不同的客體個(gè)數(shù)為Object(Pi)=card(dom[πO(σp=pi(D))]);表示包含謂詞Pi的三元組前連接基數(shù),表示包含謂詞Pi的三元組后連接基數(shù);則對(duì)于一個(gè)子查詢中兩個(gè)相連的三元組,設(shè)它們的謂詞分別為P1、P2,P1的客體與P2的主體相連,則其查詢代價(jià)為:
不同的子查詢執(zhí)行策略決定了子查詢的連接順序,而不同的子查詢連接順序的連接代價(jià)相差巨大;對(duì)于兩個(gè)子查詢Q1和Q2,它們的最小連接代價(jià)為:
其中M表示兩個(gè)子查詢相連三元組的主體取值個(gè)數(shù),N表示對(duì)應(yīng)的客體取值個(gè)數(shù);對(duì)于用戶提交的Top-K查詢語(yǔ)句Q,經(jīng)過(guò)查詢分解后得到一系列子查詢{Q1,Q2,Q3,...,Qn},這些子查詢的最優(yōu)執(zhí)行計(jì)劃采用動(dòng)態(tài)規(guī)劃算法生成;
(3)基于深度優(yōu)先和子圖剪枝的查詢計(jì)劃執(zhí)行方法
根據(jù)最優(yōu)查詢計(jì)劃執(zhí)行子查詢的過(guò)程中依然有更進(jìn)一步的優(yōu)化策略:①將前序子查詢的查詢結(jié)果作為后序子查詢的values子句,縮小后序子查詢子圖匹配范圍,進(jìn)而提高查詢效率;②針對(duì)Top-K查詢特點(diǎn),當(dāng)執(zhí)行完包含排序變量的子查詢后,采用深度優(yōu)先執(zhí)行策略對(duì)當(dāng)前查詢結(jié)果進(jìn)行剪枝,選取前K條數(shù)據(jù)作為后序子查詢的values子句,大幅度縮小所有后序子查詢子圖匹配范圍。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于湖南大學(xué),未經(jīng)湖南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010977090.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 帶有前處理和后處理的數(shù)據(jù)庫(kù)復(fù)合查詢系統(tǒng)及方法
- 數(shù)據(jù)庫(kù)查詢的方法和系統(tǒng)
- 查詢系統(tǒng)、查詢終端以及查詢方法
- 交易信息查詢方法、查詢裝置及查詢系統(tǒng)
- 數(shù)據(jù)查詢與結(jié)果生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 在RDF數(shù)據(jù)集上進(jìn)行OPTIONAL查詢的方法及存儲(chǔ)介質(zhì)
- 一種多表關(guān)聯(lián)查詢方法、裝置及設(shè)備
- 一種基于Impala的查詢方法和裝置
- 從查詢生成子查詢
- 一種基于通用查詢語(yǔ)言的查詢方法及查詢系統(tǒng)
- 通用航空飛行計(jì)劃管理系統(tǒng)
- 一種計(jì)劃書(shū)生成方法及計(jì)劃書(shū)生成設(shè)備
- 生產(chǎn)計(jì)劃裝置以及生產(chǎn)計(jì)劃方法
- 一種計(jì)量檢定配送計(jì)劃的自動(dòng)規(guī)劃分配方法
- 計(jì)劃控制方法和裝置
- 一種任務(wù)計(jì)劃的同步展示方法及智能終端
- 一種計(jì)劃的視圖展示方法及智能終端
- 計(jì)劃裝置、計(jì)劃方法以及計(jì)劃程序
- 充電計(jì)劃變更方法、裝置及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
- 一種采購(gòu)信息處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種Agent聯(lián)邦快速設(shè)計(jì)流程建模方法
- 基于聯(lián)邦模式的動(dòng)態(tài)產(chǎn)品協(xié)同開(kāi)發(fā)平臺(tái)及方法
- 一種面向深空通信的數(shù)據(jù)傳輸速率控制方法
- 一種HLA聯(lián)邦成員的動(dòng)態(tài)部署分配方法
- 聯(lián)邦學(xué)習(xí)方法、系統(tǒng)、終端設(shè)備及存儲(chǔ)介質(zhì)
- 一種混合聯(lián)邦學(xué)習(xí)方法及架構(gòu)
- 聯(lián)邦學(xué)習(xí)的沙盒機(jī)制
- 聯(lián)邦模型參數(shù)確定方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種應(yīng)用于異構(gòu)計(jì)算設(shè)備的聯(lián)邦學(xué)習(xí)系統(tǒng)和方法
- 基于區(qū)塊鏈的聯(lián)邦建模方法及裝置





