[發(fā)明專利]一種海量數(shù)據庫的XML文檔存儲和查詢的方法在審
| 申請?zhí)枺?/td> | 201310489922.9 | 申請日: | 2013-10-18 |
| 公開(公告)號: | CN104572702A | 公開(公告)日: | 2015-04-29 |
| 發(fā)明(設計)人: | 不公告發(fā)明人 | 申請(專利權)人: | 鎮(zhèn)江鼎拓科技信息有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 212009 江蘇省鎮(zhèn)江市鎮(zhèn)江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海量 數(shù)據庫 xml 文檔 存儲 查詢 方法 | ||
技術領域
一種海量數(shù)據庫的XML文檔存儲和查詢的方法主要是涉及計算機領域中的數(shù)據存儲技術。
背景技術
由于關系數(shù)據庫是目前最成熟的一種數(shù)據管理技術,在存儲和管理XML數(shù)據的各種方式中,基于關系數(shù)據庫的XML數(shù)據存儲和處理技術顯然是~種可行而有效的方式,并在學術界受到了廣泛的關注。然而,由于數(shù)據模型的差異,利用關系數(shù)據庫存儲和查詢XML數(shù)據給傳統(tǒng)數(shù)據庫技術帶來了許多新的挑戰(zhàn)。
發(fā)明內容
?通過國家專利檢索沒有發(fā)現(xiàn)關于此系統(tǒng)方面的申請資料。
本發(fā)明比較了現(xiàn)有的XML數(shù)據存儲和查詢技術的優(yōu)缺點,提出了一種新的利用關系數(shù)據庫存儲和查詢XML數(shù)據的方法,并給出具體的存儲映射算法和查詢轉換算法。利用存儲映射算法,可將XML文檔無損地存儲到固定模式的關系表中:查詢轉換算法是將查詢XML文檔的路徑表達式的核心子集轉換成SQL語句。
1、本發(fā)明提出了一種新的XML文檔基于路徑的關系存儲方法該方法是一種模式映射,它使用固定的關系模式存儲各種結構互異的XML文檔,并且這種關系模式不考慮文檔DTD的信息,因此不受它變化的限制。由于這種映射方法產生的關系表結構固定,因此為XML文檔的查詢帶來了極大的便利。該基于路徑的存儲方法全面地考慮了xML文檔樹中的每個節(jié)點信息、邊信息和值信息,將XML文檔中所有的嵌套關系都采用了兩個表來存儲:~個叫值表(Value?Table),它用來存儲XML文檔中所有有文本值的元素/屬性的相關信息;另一個叫非值表(NoValueTable),它用來記錄XML文檔中所有無文本值的中間元素的相關信息。
2、本發(fā)明針對基于路徑的存儲方法,提出了一種查詢處理機制。這種查詢機制采用表連接的方法來處理路徑表達式,查詢時需充分利用Value?Table的路徑信息,來減少由于表連接而帶來的查詢代價。
3、在用戶數(shù)據庫中再添加一個新表來存儲每條路徑的信息,這個表命名為路徑表(Path?Table)。路徑表中每個記錄是標識不同路徑的一個二元組<pathid,path>,path記錄XML文檔樹中所有不同的路徑,而pathid貝lJ是為這些各不相同的路徑設置的唯一的標識符。這樣就會避免重復地存儲相同路徑而帶來的存儲冗余。添加了路徑表后,在值表中就不再需要存儲每條路徑的全部信息,而只要存儲它們對應NpathidBP。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鎮(zhèn)江鼎拓科技信息有限公司,未經鎮(zhèn)江鼎拓科技信息有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310489922.9/2.html,轉載請聲明來源鉆瓜專利網。





