[發明專利]用于處理用于在XML數據庫中存儲的非XML文檔的方法和系統無效
| 申請號: | 200810098199.0 | 申請日: | 2008-05-26 |
| 公開(公告)號: | CN101320380A | 公開(公告)日: | 2008-12-10 |
| 發明(設計)人: | 米歇爾·蓋斯曼 | 申請(專利權)人: | 軟件股份公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 | 代理人: | 柳春雷 |
| 地址: | 德國達*** | 國省代碼: | 德國;DE |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 xml 數據庫 存儲 文檔 方法 系統 | ||
1.一種用于處理用于在XML數據庫中存儲的非XML文檔(10)的方法,包括步驟:
a.根據預定XML模式(50)生成用于非XML文檔(10)的影子XML文檔(20),所述影子XML文檔(20)包括從所述非XML文檔(10)提取的元數據;
b.在所述XML數據庫中存儲所述影子XML文檔(20)和所述非XML文檔(10);
c.其中所述XML模式(50)包括適于包裝至少部分未定義的XML結構的XML內容的包裝元素(51)。
2.如權利要求1所述的方法,其中所述包裝元素(51)定義為所述XML模式(50)的根元素。
3.如權利要求1或2所述的方法,其中使用XML文檔類型定義來定義所述包裝元素(51)。
4.如任一前述權利要求所述的方法,其中適于使用具有通配符的XQuery來搜索所述包裝元素(51)的所述XML內容。
5.如任一前述權利要求所述的方法還包括在所述影子XML文檔(20)上創建索引的步驟。
6.如前一權利要求所述的方法,其中在所述XML模式(50)中定義用于所述索引的信息(52,53)。
7.如任一前述權利要求所述的方法,其中所述非XML文檔(10)包括圖像并且其中使用圖像處理軟件提取所述元數據。
8.如任一前述權利要求所述的方法,其中所述非XML文檔(10)包括文本,尤其是.pdf文檔或Microsoft?Office文檔。
9.如任一前述權利要求所述的方法,其中所述非XML文檔(10)包括音頻和/或視頻文件。
10.如任一前述權利要求所述的方法,其中所述非XML文檔(10)是壓縮文件。
11.如任一前述權利要求所述的方法,其中所述影子XML文檔(20)包括標識所述對應非XML文檔(10)的唯一標識符。
12.包括用于執行如任一前述權利要求所述的方法的指令的計算機程序。
13.一種XML數據庫系統(1),包括:
a.適于分析非XML文檔(10)的分析器(6);
b.適于從所述非XML文檔(10)提取元數據并且根據預定義XML模式(50)生成用于所述非XML文檔(10)的影子XML文檔(20)的至少一個提取器(7),所述影子XML文檔(20)包括所述元數據;
c.適于包裝所述影子XML文檔(20)中的所提取元數據的包裝器(8),其中所包裝元數據的結構是在所述XML模式(50)中至少部分未定義的。
14.如權利要求13所述的XML數據庫系統(1)還包括適于存儲所述非XML文檔(10)和所述影子XML文檔(20)兩者的存儲裝置(3)。
15.如權利要求13或14所述的XML數據庫系統(1),其中所述分析器(6)、所述提取器(7)和所述包裝器(8)作為數據庫服務器的擴展(5)來提供。
16.如前述權利要求13到15中任意一個所述的XML數據庫系統(1),還包括基于所述影子XML文檔(20)的內容的索引。
17.如權利要求16所述的XML數據庫系統(1),其中所述索引基于所述影子XML文檔(20)的所包裝元數據中的信息(52,53)。
18.如前述權利要求13到17中任意一個所述的XML數據庫系統(1),其中所述影子XML文檔(20)包括標識所述對應非XML文檔(10)的唯一標識符。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于軟件股份公司,未經軟件股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810098199.0/1.html,轉載請聲明來源鉆瓜專利網。





