[發(fā)明專利]一種大數(shù)據(jù)量的數(shù)據(jù)稽核方法和電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202211511195.7 | 申請(qǐng)日: | 2022-11-29 |
| 公開(公告)號(hào): | CN116089436A | 公開(公告)日: | 2023-05-09 |
| 發(fā)明(設(shè)計(jì))人: | 何耀楓;趙黃起;李義;藺鶴鵬;王昱東 | 申請(qǐng)(專利權(quán))人: | 榮耀終端有限公司 |
| 主分類號(hào): | G06F16/23 | 分類號(hào): | G06F16/23;G06F16/2455 |
| 代理公司: | 北京中博世達(dá)專利商標(biāo)代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518040 廣東省深圳市福田區(qū)香蜜湖街道*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù)量 數(shù)據(jù) 稽核 方法 電子設(shè)備 | ||
1.一種大數(shù)據(jù)量的數(shù)據(jù)稽核方法,其特征在于,所述方法包括:
獲取第一文件和第二文件;
對(duì)所述第一文件進(jìn)行數(shù)據(jù)抽取,獲取第一數(shù)據(jù),所述第一數(shù)據(jù)包括至少一條數(shù)據(jù);
對(duì)所述第二文件進(jìn)行數(shù)據(jù)抽取,獲取第二數(shù)據(jù),所述第二數(shù)據(jù)包括至少一條數(shù)據(jù);
分別對(duì)所述第一數(shù)據(jù)和所述第二數(shù)據(jù)中每一條數(shù)據(jù)進(jìn)行字段拼接,生成所述第一數(shù)據(jù)和所述第二數(shù)據(jù)中每一條數(shù)據(jù)的拼接字段;
生成所述第一數(shù)據(jù)和所述第二數(shù)據(jù)中每一條數(shù)據(jù)的拼接字段對(duì)應(yīng)的身份編碼,所述身份編碼用于唯一標(biāo)識(shí)一個(gè)拼接字段;
根據(jù)所述第一數(shù)據(jù)中每一條數(shù)據(jù)對(duì)應(yīng)的身份編碼、對(duì)應(yīng)的拼接字段和第一標(biāo)志位生成所述第一數(shù)據(jù)中每一條所述數(shù)據(jù)的拼接數(shù)據(jù);
根據(jù)所述第二數(shù)據(jù)中每一條數(shù)據(jù)對(duì)應(yīng)的身份編碼、對(duì)應(yīng)的拼接字段和第二標(biāo)志位生成所述第二數(shù)據(jù)中每一條所述數(shù)據(jù)的拼接數(shù)據(jù);其中,所述第一標(biāo)志位和所述第二標(biāo)志位不同,所述第一標(biāo)志位和所述第二標(biāo)志位之和為0;
將根據(jù)所述第一數(shù)據(jù)生成的拼接數(shù)據(jù)和根據(jù)所述第二數(shù)據(jù)生成的拼接數(shù)據(jù)合并入結(jié)果文件;其中,身份編碼相同且標(biāo)志位之和為0的拼接數(shù)據(jù)被刪除;
所述結(jié)果文件包括所述第一文件和所述第二文件的差異數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述身份編碼為所述一條數(shù)據(jù)的拼接字段的校驗(yàn)和。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述對(duì)所述第一文件進(jìn)行數(shù)據(jù)抽取,獲取第一數(shù)據(jù),包括:
讀取所述第一文件中每一條數(shù)據(jù)的全部字段,獲取第一數(shù)據(jù);
所述對(duì)所述第二文件進(jìn)行數(shù)據(jù)抽取,獲取第二數(shù)據(jù),包括:
讀取所述第二文件中每一條數(shù)據(jù)的全部字段,獲取第二數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述對(duì)所述第一文件進(jìn)行數(shù)據(jù)抽取,獲取第一數(shù)據(jù),包括:
讀取所述第一文件中每一條數(shù)據(jù)的部分字段,獲取第一數(shù)據(jù);
所述對(duì)所述第二文件進(jìn)行數(shù)據(jù)抽取,獲取第二數(shù)據(jù),包括:
讀取所述第二文件中每一條數(shù)據(jù)的部分字段,獲取第二數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述對(duì)所述第一文件進(jìn)行數(shù)據(jù)抽取,獲取第一數(shù)據(jù),包括:
多次抽取所述第一文件中的數(shù)據(jù);其中,每次抽取所述第一文件中N行數(shù)據(jù),獲取一組第一數(shù)據(jù);
對(duì)所述第二文件進(jìn)行數(shù)據(jù)抽取,獲取第二數(shù)據(jù),包括:
多次抽取所述第二文件中的數(shù)據(jù);其中,每次抽取所述第二文件中N行數(shù)據(jù),獲取一組第二數(shù)據(jù);
其中,N大于或等于1。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將根據(jù)所述第一數(shù)據(jù)生成的拼接數(shù)據(jù)和根據(jù)所述第二數(shù)據(jù)生成的拼接數(shù)據(jù)合并入結(jié)果文件,包括:
根據(jù)所述第一數(shù)據(jù)生成的拼接數(shù)據(jù)生成第一臨時(shí)文件;
根據(jù)所述第二數(shù)據(jù)生成的拼接數(shù)據(jù)生成第二臨時(shí)文件;
根據(jù)所述第一臨時(shí)文件和所述第二臨時(shí)文件生成結(jié)果文件。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述第一臨時(shí)文件和所述第二臨時(shí)文件生成結(jié)果文件,包括:
依次將所述第一臨時(shí)文件和所述第二臨時(shí)文件中的拼接數(shù)據(jù)寫入至少一個(gè)中間文件;其中,每次將一個(gè)第一臨時(shí)文件或一個(gè)第二臨時(shí)文件寫入中間文件后,身份編碼相同且標(biāo)志位之和為0的拼接數(shù)據(jù)被刪除;
根據(jù)所述中間文件獲取所述結(jié)果文件。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述中間文件的名稱包括所述中間文件中拼接數(shù)據(jù)的身份編碼的最小值和最大值。
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,不同的中間文件包含的身份編碼區(qū)間不重疊。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,多個(gè)所述中間文件按照中間文件中包含的身份編碼的大小順序排列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于榮耀終端有限公司,未經(jīng)榮耀終端有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211511195.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種酸棗仁百合蜂蜜的制備方法
- 下一篇:一種彈片彎形模
- 控制壓縮數(shù)據(jù)量
- 一種基于數(shù)據(jù)庫(kù)的數(shù)據(jù)更新方法和系統(tǒng)
- 數(shù)據(jù)量的處理
- 視頻播放方法、裝置及終端
- 一種實(shí)現(xiàn)時(shí)鐘恢復(fù)的方法及裝置
- 用于監(jiān)測(cè)端口數(shù)據(jù)量的方法及裝置
- 降低視頻播放延時(shí)的方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)處理方法及裝置
- 文件讀取方法、裝置、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 數(shù)據(jù)量處理方法以及系統(tǒng)、額度分配方法以及系統(tǒng)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種流量平衡稽核的方法及系統(tǒng)
- 基于企業(yè)整體業(yè)務(wù)流程體系的在線稽核方法及系統(tǒng)
- 數(shù)據(jù)稽核方法及裝置
- 數(shù)據(jù)稽核方法、系統(tǒng)、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 自動(dòng)稽核方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)象的稽核方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)稽核方法及系統(tǒng)
- 一種稽核方法及系統(tǒng)
- 一種基于區(qū)塊鏈的數(shù)據(jù)稽核方法
- 數(shù)據(jù)的稽核方法和裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





