[發明專利]一種通用的文件自動化解析處理系統有效
| 申請號: | 201210243705.7 | 申請日: | 2012-07-13 |
| 公開(公告)號: | CN102789495A | 公開(公告)日: | 2012-11-21 |
| 發明(設計)人: | 朱峰;何文婷;石云;鄒光南 | 申請(專利權)人: | 航天恒星科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 中國航天科技專利中心 11009 | 代理人: | 安麗 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 通用 文件 自動化 解析 處理 系統 | ||
技術領域
本發明涉及一種通用的文件自動化解析處理系統,屬于文件自動化處理技術領域。
背景技術
日前,在完成工作任務中,經常需要對大量的計算機文件進行操作。按照傳統的方法,需要設計人員通過特殊軟件將若干份含有計算機能夠識別的編碼文件手動生成人能識別的漢語文件,然后交由相關人員進行翻譯。并在翻譯結束后,由設計人員將翻譯的文件一一手動生成計算機識別的編碼文件。這種手工方式帶來的問題是:一方面由于需要操作的文件較多,內容繁瑣和不易識別,且不方便操作,極易出錯;另一方面消耗了設計人員大量的時間和精力。
目前國內外文件自動解析處理方面大體分為三種:一是針對特定的領域文件;二是處理特定的XML文件;三是對數據庫文件進行統計分析。以上情況存在的問題:一是處理的對象具有針對性,業務比較單一,不具備滿足多領域文件、多種處理要求的通用性;二是不能通過簡單的配置或者修改來適應文件處理的通用性。
發明內容
本發明的技術解決問題:針對現有技術的不足,提供一種通用的文件自動化解析處理系統,針對不同領域的各種文件,通過編寫PM、XML配置文件,完成文件的自動化處理,加快文件處理速度,提高效率,解放文件處理的人力資源,并充分利用計算機資源。
本發明的技術解決方案:
一種通用的文件自動化解析處理系統,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;
指令輸入模塊接收用戶指令并將用戶指令發送給控制模塊,所述用戶指令包括配置XML文件指令、配置PM文件指令和處理用戶文件指令;控制模塊根據用戶指令的類別調用不同的模塊,
若用戶指令為配置XML文件指令,則調用XML文件配置模塊,由XML文件配置模塊讀取預設的XML文件,并且判斷該XML文件是否符合預定格式,僅當該XML文件正常,即符合預定格式時,由文件處理模塊將當前時間和該XML文件的名稱及內容存入數據庫,并且同時還將該XML文件存到XML文件指定目錄之中;
若用戶指令為配置PM文件指令,則調用PM文件配置模塊,由PM文件配置模塊讀取預設的PM文件,之后由文件處理模塊將當前時間和該PM文件的名稱存入數據庫,并且同時還將該PM文件存到PM文件指定目錄之中;
若用戶指令為處理用戶文件指令,則調用XML文件載入模塊,由XML文件載入模塊讀取存儲在XML文件指定目錄之中XML文件,之后由XML文件解析模塊對該XML文件進行解析,得到該XML文件中的對PM文件的關聯信息,并且根據所述關聯信息調用PM文件載入模塊將存儲在PM文件指定目錄中的PM文件載入,之后由文件處理模塊根據PM文件中的處理指令對用戶文件進行處理,再由文件輸出模塊將處理之后的用戶文件進行保存并輸出,即得到用戶需求文件。
所述XML文件的格式包括:
標題:用于表示該XML文件的名稱;
描述:為該XML文件本身功能的介紹;
關聯:為該XML文件關聯到PM文件的描述;
作者和日期:為該XML文件的作者及生成日期;
所述PM文件采用Perl語言編寫,該PM文件中的內容為對用戶文件的操作指令。
本發明與現有技術相比的有益效果是:
(1)本發明文件自動化解析處理系統更具有通用性:本系統不局限于某種領域的某種文件,可以批量處理不同領域的、不同文件格式的大量文件。針對不同領域的不同需求,編寫PM文件、XML配置文件可實現各類文件的解析處理。
(2)本發明中PM文件可復用性強:本發明中的PM文件使用Perl語言編寫,允許調用、繼承、修改。鑒于此,在實現新功能時,利用現有的PM文件,可縮短PM文件實現周期,降低實現難度。
附圖說明
圖1為本發明系統組成框圖;
具體的實施方式
本發明提供了一種通用的文件自動化解析處理系統,如圖1所示,包括指令輸入模塊、控制模塊、XML文件配置模塊、PM文件配置模塊、XML文件載入模塊、XML文件解析模塊、PM文件載入模塊、文件輸出模塊和文件處理模塊;
XML文件和PM文件是根據用戶需求預先編寫好的,
XML文件的格式包括:
標題(Title):用于表示該XML文件的名稱;
描述:為該XML文件本身功能的介紹;例如包括該XML文件要處理的業務的介紹,以及該XML包含的所有關聯的PM文件的介紹等等;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天恒星科技有限公司,未經航天恒星科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210243705.7/2.html,轉載請聲明來源鉆瓜專利網。





