[發明專利]對賬方法、裝置、電子設備、計算機可讀介質在審
| 申請號: | 202110886301.9 | 申請日: | 2021-08-03 |
| 公開(公告)號: | CN113590553A | 公開(公告)日: | 2021-11-02 |
| 發明(設計)人: | 張棟芳 | 申請(專利權)人: | 京東科技控股股份有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/17 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100176 北京市大興區經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法 裝置 電子設備 計算機 可讀 介質 | ||
本公開提供了一種對賬方法和裝置,涉及數據處理技術領域。該方法的一具體實施方式包括:獲取第一方對賬數據文件和第二方對賬數據文件;基于第一方對賬數據文件和第二方對賬數據文件,確定拆分數目;對第一方對賬數據文件中的數據進行拆分,生成拆分數目份第一拆分文件;對第二方對賬數據文件中的數據進行拆分,生成拆分數目份第二拆分文件;同時對拆分數目份的第一拆分文件和拆分數目份的第二拆分文件進行分布式數據驗證,得到數據驗證結果。該實施方式提高了對賬時的數據處理效率。
技術領域
本公開涉及計算機技術領域,具體涉及數據處理技術領域,尤其涉及對賬方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
背景技術
對賬系統作為微服務系統中的基石系統,需要驗證各種系統中的數據一致性,當兩方的數據量達到千萬級別或者對賬文件達到10G以上時,由于數據量巨大,經常發生對賬失敗,耗時長和效率低等問題。
發明內容
本公開的實施例提出了對賬方法和裝置、電子設備、計算機可讀介質以及計算機程序產品。
第一方面,本公開的實施例提供了一種對賬方法,該方法包括:獲取第一方對賬數據文件和第二方對賬數據文件;基于第一方對賬數據文件和第二方對賬數據文件,確定拆分數目;對第一方對賬數據文件中的數據進行拆分,生成拆分數目份第一拆分文件;對第二方對賬數據文件中的數據進行拆分,生成拆分數目份第二拆分文件;同時對拆分數目份的第一拆分文件和拆分數目份的第二拆分文件進行分布式數據驗證,得到數據驗證結果。
在一些實施例中,上述基于第一方對賬數據文件和第二方對賬數據文件,確定拆分數目,包括:分別確定第一方對賬數據文件和第二方對賬數據文件的大小;將第一方對賬數據文件的大小與預設的分文件的大小相除,得到第一方整合數目;將第二方對賬數據文件的大小與分文件的大小相除,得到第二方整合數目;選取第一方整合數目和第二方整合數目中的最小值作為拆分數目。
在一些實施例中,上述基于第一方對賬數據文件和第二方對賬數據文件,確定拆分數目,包括:以預設的第一方數據內容為第一方數據單元,計算第一方對賬數據文件中的第一方數據單元的數據數目;以預設的第二方數據內容為第二方數據單元,計算第二方對賬數據文件中第二方數據單元的數據數目;將第一方對賬數據文件的數據數目與預設的數據條數相除,得到第一方劃分數目;將第二方對賬數據文件的數據數目與數據條數相除,得到第二方劃分數目;選取第一方劃分數目和第二方劃分數目中的最小值作為拆分數目。
在一些實施例中,上述對第一方對賬數據文件中的數據進行拆分,生成拆分數目份第一拆分文件,包括:逐行讀取第一方對賬數據文件中的第一方數據單元;針對第一方對賬數據文件中的各個第一方數據單元,確定該第一方數據單元對應的子文件、以及子文件的位置;將該資方數據單元寫入子文件,得到該第一方數據單元對應的第一拆分文件。
在一些實施例中,上述對第二方對賬數據文件中的數據進行拆分,生成拆分數目份第二拆分文件,包括:逐行讀取第二方對賬數據文件中的第二方數據單元;針對第二方對賬數據文件中的各個第二方數據單元,確定該第二方數據單元對應的子文件、以及子文件的位置;將該第二方數據單元寫入子文件,得到該第二方數據單元對應的第二拆分文件。
在一些實施例中,上述第一拆分文件和第二拆分文件包括:訂單號;同時對拆分數目份的第一拆分文件和拆分數目份的第二拆分文件進行分布式數據驗證,包括:采用多線程,同時驗證拆分數目份中具有相同訂單號的第一拆分文件和第二拆分文件中的數據,得到驗證結果。
在一些實施例中,上述第一拆分文件和第二拆分文件包括:訂單號;同時對拆分數目份的第一拆分文件和拆分數目份的第二拆分文件進行分布式數據驗證,包括:按所有第一拆分文件中訂單號的排序順序,對拆分數目份第一拆分文件進行升序排序;按所有第二拆分文件中訂單號的排序順序,對拆分數目份第二拆分文件進行升序排序;將排序完成的所有第一拆分文件和第二拆分文件一一對應設置,采用多線程,同時驗證各個相對應的第一拆分文件和第二拆分文件中的數據,得到驗證結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東科技控股股份有限公司,未經京東科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110886301.9/2.html,轉載請聲明來源鉆瓜專利網。





