[發明專利]分析、轉換和拆分結構化數據的方法和裝置無效
| 申請號: | 200810080925.6 | 申請日: | 2008-02-29 |
| 公開(公告)號: | CN101520770A | 公開(公告)日: | 2009-09-02 |
| 發明(設計)人: | 李曉凱;尹宏斌 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 李 崢;于 靜 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分析 轉換 拆分 結構 數據 方法 裝置 | ||
1.一種分析結構化數據(structural?data)的方法,其特征在于,包括:
利用預先定義的與上述結構化數據相對應的模式信息(schema?information),對上述結構化數據進行分析和驗證,其中,上述模式信息包括利用正則表達式(regular?expression)表示的與該結構化數據的結構和驗證有關的信息,
其中上述利用預先定義的與上述結構化數據相對應的模式信息,對上述結構化數據進行分析和驗證的步驟進一步包括:
對上述模式信息進行分析,以解析出其中與上述結構化數據的結構和驗證有關的信息;
根據上述與結構化數據的結構和驗證有關的信息,將上述結構化數據中的各元素與上述模式信息中的相應正則表達式進行匹配,以驗證該結構化數據。
2.權利要求1所述的分析結構化數據的方法,其中,上述結構化數據包括電子數據交換文檔。
3.權利要求1所述的分析結構化數據的方法,其中上述模式信息包括:用于驗證上述結構化數據的、與上述結構化數據的層級關系相對應的每一個元素的值的正則表達式。
4.權利要求1所述的分析結構化數據的方法,其中上述模式信息是XML格式的。
5.權利要求1所述的分析結構化數據的方法,其中上述利用預先定義的與上述結構化數據相對應的模式信息,對上述結構化數據進行分析和驗證的步驟進一步包括:
根據上述與結構化數據的結構和驗證有關的信息,將上述模式信息中的正則表達式按照層級關系組裝為正則表達式樹;并且
根據上述與結構化數據的結構和驗證有關的信息,將上述結構化數據中的各元素與上述模式信息中的相應正則表達式進行匹配的步驟進一步包括:
將上述結構化數據中的各元素與上述正則表達式樹中的相應節點進行匹配。
6.權利要求1所述的分析結構化數據的方法,其中在上述匹配的步驟中進行延遲匹配。
7.權利要求5所述的分析結構化數據的方法,其中在上述匹配的步驟中進行延遲匹配。
8.權利要求1所述的分析結構化數據的方法,其中上述模式信息保存在模式文件中。
9.權利要求1所述的分析結構化數據的方法,還包括:
根據上述模式信息中與上述結構化數據的結構和驗證有關的信息,將根據該模式信息預先設定的取值路徑映射到該模式信息中的層級關系中的具體取值位置;以及
根據上述與結構化數據的結構和驗證有關的信息以及上述具體取值位置,從上述結構化數據中提取數據。
10.權利要求9所述的分析結構化數據的方法,其中上述取值路徑是以XPath格式設定的。
11.一種轉換結構化數據的方法,其特征在于,包括:
利用權利要求1~10中的任意一項所述的分析結構化數據的方法對上述結構化數據進行分析;以及
將分析后的上述結構化數據從源格式轉換為目標格式。
12.一種拆分結構化數據的方法,其特征在于,包括:
利用權利要求1~10中的任意一項所述的分析結構化數據的方法對上述結構化數據進行分析;以及
將分析后的上述結構化數據拆分為多個部分數據。
13.權利要求12所述的拆分結構化數據的方法,還包括:
分別對上述拆分后的多個部分數據添加標頭,以封裝為目標格式的包。
14.一種分析結構化數據的裝置,其特征在于,包括:
分析/驗證模塊,用于利用預先定義的與上述結構化數據相對應的模式信息,對上述結構化數據進行分析和驗證,其中,上述模式信息包括利用正則表達式表示的與該結構化數據的結構和驗證有關的信息,其中所述分析/驗證模塊進一步包括:
模式信息分析單元,用于對上述模式信息進行分析,以獲得其中與上述結構化數據的結構和驗證有關的信息;以及
驗證單元,用于根據上述與結構化數據的結構和驗證有關的信息將上述結構化數據中的各元素與上述模式信息中的相應正則表達式進行匹配,以驗證該結構化數據。
15.權利要求14所述的分析結構化數據的裝置,其中上述模式信息包括:用于驗證上述結構化數據的、與上述結構化數據的層級關系相對應的每一個元素的值的正則表達式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810080925.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種海量醫學圖像三維可視化處理系統
- 下一篇:多媒體播放調整方法及系統





