[發明專利]一種數據文件的比對方法有效
| 申請號: | 202010533593.3 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111581942B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 熊志華 | 申請(專利權)人: | 上海通聯金融服務有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F9/455 |
| 代理公司: | 上海翰信知識產權代理事務所(普通合伙) 31270 | 代理人: | 張維東 |
| 地址: | 200437 上海市虹口*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數據文件 方法 | ||
1.一種數據文件的比對方法,其特征在于,文件每行為一條單獨記錄,所述數據文件的比對方法包括以下步驟:
根據參與比對的文件的格式寫好對應配置文件;
將參與比對的文件進行預處理,將每行的key字段提取并添加到每條記錄之前;
合并所有參與比對的文件,形成合成文件,形成合成文件的步驟包括:將所有參與比對的文件依次編號;按照順序排列各key字段;在各key字段范圍內按照參與比對的文件編號順序依次羅列各文件的記錄,使key字段相同的記錄按照參與比對的文件編號順序依次羅列在一起;
根據配置文件生成用于比對的awk腳本工具;
使用awk腳本工具遍歷合成文件得到比對結果。
2.如權利要求1所述的數據文件的比對方法,其特征在于,使用awk腳本工具遍歷合成文件得到比對結果包括以下步驟:
將所述合成文件中相同key字段范圍內所有參與比對的文件中的記錄依次進行比對。
3.如權利要求2所述的數據文件的比對方法,其特征在于,對于任一相同key字段范圍內所有參與比對的文件中的記錄依次進行比對的步驟如下:
逐行處理,若所有參與比對的文件中有一個或多個有數值域,則獲取有數值域的文件;
若有多個文件有該key字段的數值域,則逐個域值進行對比。
4.如權利要求1所述的數據文件的比對方法,其特征在于,所述配置文件用于描述每條記錄中的字段名稱、字段順序、字段長度、字段類型以及字段描述。
5.如權利要求1所述的數據文件的比對方法,其特征在于,所述key字段為每條記錄的唯一編號。
6.如權利要求3所述的數據文件的比對方法,其特征在于,所述key字段的數值域由字段名稱、字段順序、字段長度、字段類型以及字段描述組成。
7.如權利要求6所述的數據文件的比對方法,其特征在于,所述域值為字段名稱、字段順序、字段長度、字段類型或字段描述的值。
8.如權利要求1所述的數據文件的比對方法,其特征在于,使用awk腳本工具遍歷合成文件得到比對結果還包括以下步驟:
縱向統計每個數值域差異的數量信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海通聯金融服務有限公司,未經上海通聯金融服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010533593.3/1.html,轉載請聲明來源鉆瓜專利網。





