[發明專利]基于序列模式的數據導入及查詢方法無效
| 申請號: | 200810056100.0 | 申請日: | 2008-01-11 |
| 公開(公告)號: | CN101216852A | 公開(公告)日: | 2008-07-09 |
| 發明(設計)人: | 孟小峰;蔣瑜 | 申請(專利權)人: | 孟小峰 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京中創陽光知識產權代理有限責任公司 | 代理人: | 尹振啟 |
| 地址: | 100872北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 序列 模式 數據 導入 查詢 方法 | ||
技術領域
本發明涉及計算機數據庫和網絡技術領域,特別是涉及一種基于序列模式的數據導入及查詢方法。
背景技術
隨著信息技術的飛速發展,可擴展標記語言XML作為事實上的數據描述和交換標準已經得到了廣泛的應用.有關XML文檔的各種處理技術成為大量研究者關注的熱點問題.XML文檔包含具有層次嵌套關系的元素信息,因此XML文檔可以很自然的用一棵文檔樹來表示,Twig(小樹)查詢就是從文檔樹中找到和Twig匹配的元素序列,因此,Twig查詢是XML查詢中最重要的部分.對于給定的一個twig查詢,大多數XML索引方法在求解時會將該查詢分解為幾個子查詢分別求解,然后再將每個子查詢的結果根據連接條件執行連接操作以得到最終的解。其中連接操作已經被大家公認為最耗費時間的操作,其主要缺點是需要執行多次連接操作,這樣做所帶來的兩個直接問題是:
(1)需要重復處理大量數據元素。由于Twig中任意兩個有連接關系的節點對應的數據元素都需要處理一遍,且除了根節點之外的非葉節點都至少和兩個其它節點對應,因此,這些節點對應的數據元素都至少被處理兩遍。這就導致系統的整體效率由于這些重復處理工作而明顯下降。
(2)需要緩存大量無用的中間結果。由于滿足任意兩個節點之間約束關系的結果對于用戶提交的查詢來說都是局部解,因此無法判定其是否可以構成最終的解。則所有的中間結果都需要首先緩存起來,在最后執行連接操作的時候才能判斷其是否是有用的。這樣一來,可能會造成緩存大量無用中間結果的現象,這將嚴重影響系統的處理效率。
以上兩個問題會進一步隨著查詢規模的增大而給系統的整體處理性能帶來嚴重的威脅。引起這種問題的根源在于已有方法的數據模型是樹,因此,對于給定的查詢,需要將樹首先分解為可以直接處理的子樹分別求解,然后再將各個子查詢的解進行整理連接處理才能得到最終的解。
發明內容
為了解決上述傳統問題,因此本發明的一個目的就是提出了一種基于序列模式的數據導入及查詢方法。
在本發明的一個方面中,一種基于序列模式的數據導入方法,包括:A、對于當前需要存儲的文檔,首先需要對其進行解析,識別出來哪些數據表示元素節點,哪些數據表示元素節點對應的值;B、對于識別出來的元素節點進行編碼,構建編碼和元素之間的一一對應關系;C、構建和文檔元素對應的編碼序列,這個序列和原文檔之間具有相互對應關系,可以根據序列重新構建原文檔;D、將構建好的序列組織為B+樹的形式存于磁盤上,同時構建元素和其值對應的關系表,并存于數據庫中。
在本發明的另一個方面中,一種基于序列模式的數據查詢方法,包括:A、對于用戶提交的查詢進行解析,識別出查詢節點之間的約束關系以及其他謂詞關系;B、系統根據特定的算法將該查詢轉化為序列;這個序列保持了原查詢的結構特性,具有和原樹形查詢等價的結構特性;C、根據特定的序列匹配算法,從原文檔對應的序列中找與用戶查詢等價的序列匹配的文檔片斷;D、將匹配的結果以特定的形式返回給用戶。
在本發明的這個方面中,其中約束方法是父子關系或者祖先后代關系。
附圖說明
結合隨后的附圖,從下面的詳細說明中可顯而易見的得出本發明的上述及其他目的、特征及優點。在附圖中:
圖1給出了根據本發明的體系結構圖;
圖2給出了根據本發明的數據導入數據庫的流程圖;
圖3給出了根據本發明的用戶查詢流程圖。
具體實施方式
針對已有的查詢處理方法存在的問題,我們從另外一個新的角度——序列——切入。即我們將XML數據和查詢都看成是編碼序列,這樣一來,樹的匹配問題轉化為了字符串之間的匹配問題。這種數據結構能夠保證查詢的等價性,更重要的是,通過使用序列匹配,twig查詢的處理不用像已有的方法一樣需要借助于連接操作來求解,可以直接求解。而且,XSeq索引同時對數據和結構進行索引。
下面結合附圖,對本發明進行詳細地描述。
圖1給出了根據本發明的體系結構圖。如圖1所示,這種索引方法建立的系統中需要三種設備。首先是數據庫服務器,用以運行數據庫管理系統和管理大量序列化的XML文檔。其次是網絡服務器,最后是終端設備,用以從用戶方接收查詢和為用戶展示查詢結果。當然還可以包括一些外圍輔助設備,如打印機等。
下面參考圖2,對根據本發明的數據導入數據庫的流程進行詳細的說明。
當系統硬件平臺搭建好之后,就可以向數據庫服務器中存儲XML文件了。這個過程是由數據庫服務器自動完成的,步驟如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于孟小峰,未經孟小峰許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810056100.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





