[發明專利]可擴展標記語言文件轉換器及其轉換方法無效
| 申請號: | 201110232145.0 | 申請日: | 2011-08-15 |
| 公開(公告)號: | CN102262676A | 公開(公告)日: | 2011-11-30 |
| 發明(設計)人: | 何琦;劉嘉順 | 申請(專利權)人: | 何琦;劉嘉順 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/22 |
| 代理公司: | 中國商標專利事務所有限公司 11234 | 代理人: | 陳麗新 |
| 地址: | 200065 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 擴展 標記 語言 文件 轉換器 及其 轉換 方法 | ||
技術領域
本發明涉及文件轉換,尤其是在Unix平臺下使用面向過程的計算機程序設計語言將Flat文件轉換為XML文件。
背景技術
目前,銀行業的絕大部分文件都是以Flat文件為標準進行交互,Flat文件是一種包含沒有相對關系結構的記錄的文件。這個類型通常用來描述文字處理、其他結構字符或標記被移除了的文本。但是部分銀行為了增強數據的可讀性,采用XML文件(XML(Extensible?Markup?Language即可擴展標記語言)存儲數據,從而對數據交互提出了新的要求。傳統轉換方法是采用XSD來對目標XML數據文件的格式進行定義。XSD(XML?Schemas?Definition)是指XML結構定義,描述了XML文檔的結構。在Unix平臺下以java語言等面向對象的計算機程序語言已經有通過讀取XSD文件將Flat文件轉換為XML文件的現成轉換器,但以C語言等面向過程的計算機程序語言還沒有讀取XSD文件來轉換Flat文件到XML文件的轉換器。
發明內容
本發明可擴展標記語言文件轉換器目的在于提供一種面向過程的計算機程序語言讀取XSD文件來轉換Flat文件到XML文件的轉換器及其轉換方法。
本發明提供技術方案如下:
一種可擴展標記語言文件轉換器,其特征在于包括一個文件分割裝置,用于按照屬性將Flat文件的每條記錄分割為獨立字段并命名;一個文件解析裝置,用于表示各字段的邏輯結構;一個文件映射裝置,用于將分割、解析的結果映射到XML文件里;
所述解析裝置包括名稱及相應的樹形結構定義和層次,所述樹形結構定義包括根節點、分支節點和葉節點三種;
所述映射裝置讀取解析裝置的內容,將所述字段按照所述樹形結構和層次排列成目標XML文件;所述映射裝置讀取時,當下一個名稱的層次小于或等于上一個名稱的層次時,寫上一個名稱的結束部分;每個名稱入棧前先判斷上一個名稱是否結束,如果結束則上一個名稱先出棧,當前名稱再入棧,如果沒有結束,則僅當前名稱入棧。
所述解析裝置還包括一個表明是否在根和分支的節點處是否填寫屬性值的值標記。
所述解析裝置還包括一個表明字段數據類型的數據類型標記。
所述文件中的每條記錄包括一個所述根節點,至少一個所述葉節點,且葉節點沒有下屬任何節點。
所述文件中的每條記錄還包括至少一個所述分支節點,所述分支節點屬于根節點或者其他分支節點,所述分支節點具有下屬分支節點或者葉節點。
一種可擴展標記語言文件轉換方法,包括以下步驟,
a利用文件分割裝置按照屬性將Flat文件的每條記錄分割為獨立字段;
b讀取文件解析裝置中的根節點,搜索所述字段中與根節點的名稱相同的內容,并將所述字段的值填入目標XML文件中;
c讀取文件解析裝置中的下一節點,并按照所述名稱相應的樹形結構定義和層次找到節點位置,搜索所述字段中與此節點的名稱相同的內容,并將所述字段的值填入目標XML文件中;
重復上述c步驟,完成一條記錄的目標XML文件;
每條記錄均按照上述方法進行轉換,完成全部目標XML文件。
本發明的有益效果為:
提供一種面向過程的計算機程序語言讀取XSD文件來轉換Flat文件到XML文件的轉換器及其轉換方法。
眾所周知采用XSD文件描述的XML文檔,適合面向對象的計算機程序語言進行解析,而且國外公司如Sun公司提供了成熟的工具包給開發人員進行簡單的調用即可根據XSD文件將Flat文件轉換為XML文件,但無法適用于面向過程的計算機程序語言。
在銀行業這種數據量極大的業務平臺上,對數據處理的效率要求很高,對每一條記錄處理速度提高哪怕快幾個微秒的數量級,累計疊加到上百萬千萬條數據后,其提高的時間量是驚人的。而面向過程的計算機程序語言如C語言和面向對象的計算機程序語言如Java語言相比在Unix平臺下對相同數據量的處理速度要快很多,因為C語言是直接編譯生成可執行文件被機器執行的,而Java語言是經過Java虛擬機解析后生成可執行文件被機器執行。
采用面向過程的計算機程序語言結合本發明的可擴展標記語言文件轉換器,可以實現最高效的運行速度,此發明已經在某些銀行業的批處理系統上線運行,得到了滿意的運行效果。
此外,可擴展標記語言文件轉換器的文件解析裝置可以根據各個銀行業務需要的不同進行定制和擴展,滿足日益增長的數據要求和業務要求。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于何琦;劉嘉順,未經何琦;劉嘉順許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110232145.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:內孔壁直線溝槽磨頭機構
- 下一篇:基于粗糙分類知識發現的快速屬性約簡方法





