[發明專利]一種基于描述的XML增量抽取方法有效
| 申請號: | 201710067077.4 | 申請日: | 2017-02-06 |
| 公開(公告)號: | CN107045495B | 公開(公告)日: | 2020-04-24 |
| 發明(設計)人: | 周由甲 | 申請(專利權)人: | 浪潮通用軟件有限公司 |
| 主分類號: | G06F40/123 | 分類號: | G06F40/123;G06F40/14;G06F16/81 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 描述 xml 增量 抽取 方法 | ||
本發明提供一種基于描述的XML增量抽取方法,屬于應用軟件數據存儲領域,本發明通過用戶在配置文件中配置某一類型基礎數據的屬性控制配置,同時為每個基礎數據添加屬性控制規則,來實現對擴展屬性中增量的抽取與存儲。通過本方法,可以減少在存儲擴展屬性時造成的數據冗余,同時可以達到修改基礎數據的同時同步修改擴展數據相應內容的功能,減少重復的工作,增加工作效率。
技術領域
本發明涉及應用軟件數據存儲領域,尤其涉及一種基于描述的XML增量抽取方法。
背景技術
XML,即可擴展標記語言,是一種簡單的數據存儲語言,使用一系列簡單的標記描述數據,而這些標記可以用方便的方式建立,雖然可擴展標記語言占用的空間比二進制數據要占用更多的空間,但可擴展標記語言極其簡單易于掌握和使用。
現如今在很多系統中都大量的應用到XML來存儲數據,并且將某些數據作為基礎數據,這部分數據并不會頻繁的變動,同時又存在基于這些基礎數據進行調整而產生的擴展數據。舉例來說,系統中一個表單作為基礎數據,而為了應對某用戶的個性化要求,對這個表單的背景圖片和控件位置等內容進行調整,從而生成另一個表單作為擴展數據。這樣的操作會造成以下兩個問題:第一,隨著業務的不斷增多,擴展數據的量會越來越大,而事實上,擴展數據和基礎數據之間的差別往往是非常小的,這也就造成了大量的數據冗余;第二,有些對于基礎數據的修改,往往希望同時展現的擴展數據上。例如,在基礎表單上增加了一個新的屬性并添加了一個控件,那么擴展表單上就也需要去手動添加同樣的屬性和控件。如果擴展表單數量更多,那么工作量也就隨之倍增,這樣就無形中增加了很多重復的工作,影響工作效率,同時又容易出現錯誤。
發明內容
為了解決以上技術問題,本發明提出了一種將基于XML描述的基礎數據與其擴展數據對比,并將兩者的不同以增量的方式進行抽取與存儲的方法。
將擴展數據中修改的內容以增量的方式提取并存儲,有效的解決了上述第一個問題。同時在獲取擴展數據時,將增量與基礎數據按照規則合并,使得基礎數據中后改的數據也能反應到擴展數據中,來解決上述的第二個問題。
本發明的技術方案是:
一種基于描述的XML增量抽取方法,它包含以下步驟:
A.定義屬性控制配置。
B.定義屬性控制規則。
C.調用增量抽取方法。
通過用戶在配置文件中配置某一類型基礎數據的屬性控制配置,同時為每個基礎數據添加屬性控制規則,來實現對擴展屬性中增量的抽取與存儲。
在步驟A,定義某一類基礎數據的屬性控制配置。這類數據具有高度相似的結構(節點的名稱及父子關系相同,數量可能存在差異)。通過屬性控制配置,來確定某一類基礎數據中各類節點的增量抽取規則。屬性控制配置的屬性包括:元素名稱、配置類型、父配置節點ID、ID屬性名稱和屬性配置集合五個屬性。具體描述如下:
屬性配置集合中包含了一系列屬性配置明細,屬性配置明細包括節點屬性名稱、節點屬性類型、屬性修改規則和子節點修改規則四個屬性。具體描述如下:
在步驟B,定義某個基礎數據的所有需要增量操作的屬性的控制規則。某一類基礎數據通常會存在很多基礎數據,而每一個基礎數據上特定屬性的控制規則可能不盡相同,這就需要針對特定的要求制定一套屬于該基礎數據的屬性控制規則。
屬性規則中會按照XML數據的父子結構劃分,每一層結構會有一套規則,最后將所有層次的規則記錄到一個集合中,形成一套屬性控制規則。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮通用軟件有限公司,未經浪潮通用軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710067077.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:矩陣處理裝置
- 下一篇:一種實現數據查詢的方法和服務器





