[發明專利]一種XML關鍵字查詢方法有效
| 申請號: | 201410284885.2 | 申請日: | 2014-06-23 |
| 公開(公告)號: | CN104166672B | 公開(公告)日: | 2017-11-17 |
| 發明(設計)人: | 馮鈞;朱祖會;唐志賢;許瀟;杜丙帥;査顯月;王純;李宗祥;魏童童;朱躍龍;李士進;萬定生 | 申請(專利權)人: | 河海大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 南京經緯專利商標代理有限公司32200 | 代理人: | 朱小兵 |
| 地址: | 211100 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 xml 關鍵字 查詢 方法 | ||
1.一種XML關鍵字查詢方法,其特征在于,包括如下步驟:
步驟1,確定XML文檔關鍵字序列的BLCEA節點集合,
所述BLCEA節點為實體節點,去掉BLCEA節點的子孫中包含所有查詢關鍵字的實體節點之后,剩余的子孫中仍然包含所有查詢關鍵字:
步驟1-1,初始化BLCEA節點集合為空;
步驟1-2,獲得所有關鍵字匹配節點的有序LDewey編碼集合,所述LDewey編碼包括:關鍵字匹配節點所處層次信息、關鍵字匹配節點的祖先節點在各自所處層次中的位置信息、關鍵字匹配節點在所處層次中的位置信息;
步驟1-3,由出現關鍵字匹配節點的最高層次開始逐層尋找BLCEA節點:對每一層中的各節點,當有實體節點是該層中所有關鍵字匹配節點的公共祖先時,將該實體節點加入BLCEA節點集合中,并在LDewey編碼集合中刪去以該實體節點為祖先的關鍵字匹配節點編碼;
步驟2,利用結果排序算法對以BLCEA節點集合各節點為根的子樹進行排序,返回用戶最理想的結果:
步驟2-1,在以每個BLCEA節點為根的子樹中計算關鍵字匹配度,按匹配度大小對BLCEA節點集合中的節點排序,并把以BLCEA節點集合中所有節點為根的子樹都返回給用戶,在關鍵字匹配度相等時進入步驟2-2;
步驟2-2,求出關鍵字在匹配度相等的BLCEA節點為根的子樹中的最短距離,按照最短距離遞增的順序排列各BLCEA節點,最短距離由以下表達式求得,前一個關鍵字匹配節點k1、后一個關鍵字匹配節點k2在同一條路徑上,則最短距離:
dist(k1,k2)=|LDewey(k1).level-LDewey(k2).level|,
前一個關鍵字匹配節點k1、后一個關鍵字匹配節點k2不在同一條路徑上,則最短距離:
dist(k1,k2)=LDewey(k1).level+LDewey(k2).level-2LDewey(v).level,
其中,LDewey(k1).level為前一關鍵字匹配節點k1所處層次信息,LDewey(k2).level為后一關鍵字匹配節點k2所處層次信息,LDewey(v).level為子樹根節點所處層次信息。
2.根據權利要求1所述的XML關鍵字查詢方法,其特征在于,步驟2-1中關鍵字匹配度的計算方法如下:前一個關鍵字的文本值等于后一個關鍵字文本值時,記匹配度為1,否則,記匹配度為0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410284885.2/1.html,轉載請聲明來源鉆瓜專利網。





