[發(fā)明專利]一種基于多樣性XML文檔近似查詢方法無效
| 申請(qǐng)?zhí)枺?/td> | 200710018535.1 | 申請(qǐng)日: | 2007-08-24 |
| 公開(公告)號(hào): | CN101114291A | 公開(公告)日: | 2008-01-30 |
| 發(fā)明(設(shè)計(jì))人: | 覃征;衡星辰;邵利平;姜山 | 申請(qǐng)(專利權(quán))人: | 西安交通大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 | 代理人: | 陳翠蘭 |
| 地址: | 710049*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多樣性 xml 文檔 近似 查詢 方法 | ||
1.一種基于多樣性XML文檔近似查詢方法,其特征在于:該方法包括XML文檔多樣性處理,單DTD下XML文檔近似查詢,查詢代價(jià)評(píng)估和Top-K問題求解四個(gè)部分;
XML文檔多樣性處理模塊采用基于PTO模型的映射規(guī)則自動(dòng)生成算法將用戶在全局查詢模式下提出的原始查詢重寫為不同DTD下的重寫查詢樹;單DTD下XML文檔近似查詢模塊利用重寫查詢樹,結(jié)合基本變異操作,通過對(duì)變異查詢樹的多次精確嵌入實(shí)現(xiàn)了單DTD下XML文檔集的近似查詢;查詢代價(jià)評(píng)估模塊采用基于XML樣本數(shù)據(jù)分布統(tǒng)計(jì)的方法,計(jì)算了每一個(gè)查詢結(jié)果的查詢代價(jià);Top-K問題求解模塊通過對(duì)結(jié)點(diǎn)進(jìn)行區(qū)間編碼,并借助最優(yōu)變異查詢樹的預(yù)先估計(jì),最終實(shí)現(xiàn)了對(duì)多樣性XML文檔近似查詢的Top-K求解。
2.根據(jù)權(quán)利要求1所述的一種基于多樣性XML文檔近似查詢方法,其特征在于,XML文檔多樣性處理模塊的實(shí)現(xiàn)步驟如下:
1)依據(jù)基于本體的全局查詢模式,按照面向?qū)ο蟛樵冋Z言提出原始查詢;
2)依據(jù)PTO模型:(v1,v2)->c1.role,c2.inverse(role)|c3.attribute,按如下步驟建立DTD和全局查詢模式之間的映射規(guī)則集:
(1)廣度優(yōu)先遍歷DTD樹TDTD,抽取TDTD中每條有向邊對(duì)應(yīng)的結(jié)點(diǎn)v1和v2,若已遍歷結(jié)束,轉(zhuǎn)步(4);否則,轉(zhuǎn)步(2);
(2)查找v1和v2在全局查詢模式圖G中對(duì)應(yīng)的概念結(jié)點(diǎn)v1和v2或?qū)傩詀ttribute,若找到,轉(zhuǎn)步(3);否則,把二元組(v1,v2)加入集合Set1中,轉(zhuǎn)步(1);
(3)如果找到的是兩個(gè)概念結(jié)點(diǎn)c1和c2,則生成規(guī)則:(v1,v2)->c’1.role,c’2.inverse(role),轉(zhuǎn)步(1);如果找到的是一個(gè)概念結(jié)點(diǎn)c1和屬性attribute,則生成規(guī)則:(v1,v2)->c1.attribute,轉(zhuǎn)步(1);
(4)對(duì)Set1集合中的二元組使用規(guī)則:(x,y),(y,z)|-(x,z)進(jìn)行擴(kuò)展,將新生成的擴(kuò)展二元組放入集合Set2;
(5)遍歷集合Set2,抽取其中每一個(gè)元組中的結(jié)點(diǎn)v1和v2;若已遍歷結(jié)束,則終止算法;否則,轉(zhuǎn)步(6);
(6)查找v1和v2在全局查詢模式圖G中對(duì)應(yīng)的概念結(jié)點(diǎn)c1和c2或?qū)傩詀ttribute,若找到,轉(zhuǎn)步(7);否則,轉(zhuǎn)步(5);
(7)如果找到的是兩個(gè)概念結(jié)點(diǎn)c1和c2,生成規(guī)則:(v1,v2)->c’1.role,c’2.inverse(role)轉(zhuǎn)步(5);如果找到的是一個(gè)概念結(jié)點(diǎn)c1和屬性attribute,生成規(guī)則:(v1,v2)->c1.attribute轉(zhuǎn)步(5);
3)利用生成的映射規(guī)則集按模式路徑,概念和角色逐一映射的方式將原始查詢改寫為不同DTD下的結(jié)構(gòu)謂詞集,并由結(jié)構(gòu)謂詞集進(jìn)一步構(gòu)成為重寫查詢樹形式。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安交通大學(xué),未經(jīng)西安交通大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710018535.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- Java中的XML類型
- 數(shù)據(jù)庫中XML模式的原地演進(jìn)
- 在標(biāo)記語言環(huán)境中使用可撤消命令來編輯文檔的文檔處理和管理方法
- XML文檔管理系統(tǒng)及其方法與XML文檔訪問控制方法
- 用于處理用于在XML數(shù)據(jù)庫中存儲(chǔ)的非XML文檔的方法和系統(tǒng)
- 一種XML元數(shù)據(jù)對(duì)象化解析方法及系統(tǒng)
- 一種XML信息獲取方法和系統(tǒng)
- 將XML文檔自動(dòng)轉(zhuǎn)化為OML文檔的轉(zhuǎn)換方法及裝置
- XML數(shù)據(jù)的處理方法和裝置
- 一種XML注入漏洞檢測與防御方法
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備





