[發明專利]數據并行處理方法、裝置、設備及存儲介質在審
| 申請號: | 202010199891.3 | 申請日: | 2020-03-20 |
| 公開(公告)號: | CN111400012A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 陳軍;唐成山 | 申請(專利權)人: | 中國建設銀行股份有限公司;建信金融科技有限責任公司 |
| 主分類號: | G06F9/48 | 分類號: | G06F9/48;G06F9/50 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 并行 處理 方法 裝置 設備 存儲 介質 | ||
本發明實施例提供一種數據并行處理方法、裝置、設備及存儲介質。包括:若待處理任務支持分片,獲取數據拆分規則;根據所述拆分規則將所述待處理任務拆分為多個子任務;將所述多個子任務分配至對應的線程進行處理,獲得多個子結果;將所述多個子結果進行合并,獲得數據處理結果。本發明實施例提供的數據并行處理方法,將待處理任務拆分為多個子任務,然后將多個子任務分配至對應的線程中并行處理,最后將各個子結果合并,獲得最終的數據處理結果,可以減少單個作業處理的批處理時間,從而提高數據的處理效率。
技術領域
本發明實施例涉及數據處理技術領域,尤其涉及一種數據并行處理方法、裝置、設備及存儲介質。
背景技術
商業銀行核心系統基于IBM大型機構建,大型機上的聯機、批處理基于文件,并在計算過程中沒有網絡損耗,但是從大型機下移到X86開放系統后,X86系統CPU、網絡通訊、IO等損耗增加,單一機器無法滿足大型銀行10億級以上的業務處理,通過對業務數據進行業務領域垂直拆分,數據量水平拆分來解決數據庫瓶頸,但是在批處理中,一個批次的數據文件達到百萬級,如果按由單臺進行處理,仍然無法實現高效的計算。因而提高數據的處理效率顯得尤為重要。
發明內容
本發明實施例提供一種數據并行處理方法、裝置、設備及存儲介質,通過數據分片,把一個任務按一定比例拆分成多片,并在不同機器上并行運行,來減少單個作業處理的批處理時間,從而提高數據的處理效率。
第一方面,本發明實施例提供了一種數據并行處理方法,包括:
若待處理任務支持分片,獲取數據拆分規則;
根據所述拆分規則將所述待處理任務拆分為多個子任務;
將所述多個子任務分配至對應的線程進行處理,獲得多個子結果;
將所述多個子結果進行合并,獲得數據處理結果。
進一步地,獲取數據拆分規則,包括:
根據所述待處理任務的身份標識碼獲取分片參數;
根據所述分片參數確定數據拆分規則。
進一步地,在根據設定拆分規則將所述待處理任務拆分為多個子任務,包括:
注冊拆分表;
將拆分的多個子任務的信息登記至所述拆分表中;所述拆分表用于記錄拆分進度。
進一步地,所述子任務的信息包括:子任務的身份識別碼、輸入文件路徑、輸出文件路徑及記錄條數。
進一步地,將所述多個子任務分配至對應的線程進行處理,獲得多個子結果,包括:
根據子任務的信息按照鎖機制將所述多個子任務分配至對應的線程進行處理,獲得多個子結果。
第二方面,本發明實施例還提供了一種數據并行處理裝置,包括:
數據拆分規則獲取模塊,用于若待處理任務支持分片,獲取數據拆分規則;
子任務獲取模塊,用于根據所述拆分規則將所述待處理任務拆分為多個子任務;
子結果獲取模塊,用于將所述多個子任務分配至對應的線程進行處理,獲得多個子結果;
數據處理結果獲取模塊,用于將所述多個子結果進行合并,獲得數據處理結果。
進一步地,所述數據拆分規則獲取模塊,還用于:
根據所述待處理任務的身份標識碼獲取分片參數;
根據所述分片參數確定數據拆分規則。
進一步地,所述子任務獲取模塊,還用于:
注冊拆分表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司;建信金融科技有限責任公司,未經中國建設銀行股份有限公司;建信金融科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010199891.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:資訊推薦方法及裝置
- 下一篇:一種分頁查詢方法、系統和電子設備
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





