[發明專利]一種基于標簽的數據采集方法與系統有效
| 申請號: | 200810227560.5 | 申請日: | 2008-11-28 |
| 公開(公告)號: | CN101751382A | 公開(公告)日: | 2010-06-23 |
| 發明(設計)人: | 郭麗新;龔健 | 申請(專利權)人: | 方正國際軟件(北京)有限公司 |
| 主分類號: | G06F17/22 | 分類號: | G06F17/22;G06F9/44 |
| 代理公司: | 北京天悅專利代理事務所 11311 | 代理人: | 田明;任曉航 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 標簽 數據 采集 方法 系統 | ||
技術領域
本發明屬于信息處理領域,具體涉及一種基于標簽的數據采集方法與系統。
背景技術
數據采集是信息系統中的一個首要環節,用戶需要采集的數據千差萬別,數據的表現形式及應用邏輯也各不相同,最重要的是不同應用程序的用戶交互界面,對界面數據采集的方法有所不同,典型如瀏覽器的網頁,是通過id以及名稱來提交用戶填寫數據的,而一般窗口程序則通過id來收集數據,這些用戶交互界面對用戶提交數據采集方式的差異性,使得開發工作變得復雜并且工作量增大,更重要的后期程序升級必須修改程序本身,特別是針對有不間斷持續運行要求的系統無法實現升級處理。
現有的技術方案的通用做法是:通過定制與用戶交互界面采集的數據格式相關的不同處理規則,實現將數據回寫到源數據中,這種處理方式在目前移動終端、WEB應用、桌面處理等一體化的綜合應用系統中,必然會產生大量的工作量,系統升級也不是很靈活。
國內專利01116912.5提到“一種實現多業務數據交換的方法及其裝置”,其通過服務器端將從各終端設備的輸入頁面中采集到業務交易數據和隱含數據轉換生成動態的可擴展標記語言字符串,并根據這一隱含數據,讀取對應的可擴展的樣式語言文件,并將其轉換成可擴展樣式語言字符串;最后,在一處理器中,生成最終用于數據交換的并針對不同業務數據格式的可擴展標記語言。該發明通過隱藏的字符串實現了XML數據格式與業務無關,從而節省一定的程序開發量。
該專利的局限性在于,只涉及到依據業務規則使數據支持不同的業務,而對收集到的數據沒有做任何處理,未提出從數據本身出發進行識別、驗證等處理。
發明內容
針對現有技術中存在的問題,本發明的目的是提供一種基于標簽的數據采集方法與系統,該方法與系統能夠在保持原有數據不變的前提下,通過模板、標簽等方式實現數據的動態轉換,而模板和標簽又能夠針對不同?應用進行動態配置,從而增加了數據的可操作性和邏輯性,實現了多種數據格式的統一處理,實現了系統運行時的業務變更,并減少了因數據調整帶來的差異性編程。
應用進行動態配置,從而增加了數據的可操作性和邏輯性,實現了多種數據格式的統一處理,實現了系統運行時的業務變更,并減少了因數據調整帶來的差異性編程。
本發明的目的是這樣實現的:
一種基于標簽的數據采集方法,包括如下步驟:
1)規則預處理和標簽預處理:預處理裝置獲取源數據,根據模板中定義的數據處理規則對源數據進行模板匹配,預處理裝置對源數據附加標簽生成標記數據,并將標記數據提交給數據采集裝置;
2)數據采集裝置通過將皮膚文件和標記數據合成生成用戶交互界面文件,生成顯示用戶交互界面,用戶填寫后提交;
3)數據采集裝置將用戶交互界面提交的用戶數據,按照標簽回寫到標記數據中;
4)數據還原裝置依據步驟(1)中的模板和數據處理規則將標記數據中修改部分回寫到源數據中,完成數據采集過程;
進一步,步驟1)中,所述規則預處理包含以下步驟:
a.預處理裝置接受源數據,開始數據預處理流程;
b.根據配置信息,預處理裝置讀取源數據使用的模板庫中的模板文件,根據模板文件中的配置進行處理;
c.預處理裝置循環處理數據結點;
d.預處理裝置讀取并解析模板中的數據處理規則;
e.根據解析后的數據結點規則類型,調用相對應的模板文件中的數據處理規則;
f.按照模板文件中的規則,對源數據進行相應的預處理操作;
g.判斷是否處理完所有數據,如果是,則退出循環處理流程,否則執行步驟c;
h.預處理裝置得到規則預處理后的數據。
所述標簽預處理包含以下步驟:
A.分析應用規則,不同的應用規則應該添加不同的標簽以方便識別;
B.根據應用規則調用預處理裝置中相對應的標簽處理裝置;
C.循環處理數據結點;
D.標簽處理裝置為數據結點添加標簽,所述標簽是以屬性形式的名稱-字符串對添加在數據結點中;
E.判斷是否處理完所有數據結點,若處理完,則退出循環處理流程;否則執行步驟C;
F.預處理裝置得到預處理后的標記數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于方正國際軟件(北京)有限公司,未經方正國際軟件(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810227560.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:制作觸控面板的方法
- 下一篇:字典的數據文件轉換為二進制文件的轉換方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





