[發(fā)明專利]一種NiFi同步數(shù)據(jù)量統(tǒng)計方法有效
| 申請?zhí)枺?/td> | 202110001764.2 | 申請日: | 2021-01-04 |
| 公開(公告)號: | CN112732662B | 公開(公告)日: | 2023-03-28 |
| 發(fā)明(設計)人: | 翟建峰;胡清;李國濤 | 申請(專利權(quán))人: | 浪潮云信息技術(shù)股份公司 |
| 主分類號: | G06F16/178 | 分類號: | G06F16/178;G06F16/16 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 郗艷榮 |
| 地址: | 250100 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 nifi 同步 數(shù)據(jù)量 統(tǒng)計 方法 | ||
1.一種NiFi同步數(shù)據(jù)量統(tǒng)計方法,其特征在于:基于NiFi數(shù)據(jù)文件批次標識,數(shù)據(jù)文件編碼以及數(shù)據(jù)文件數(shù)據(jù)量標識屬性實現(xiàn)對同步數(shù)量的統(tǒng)計;
具體包括以下步驟:
第一步,生成NiFi數(shù)據(jù)文件批次標識;
第二步,對數(shù)據(jù)文件進行編碼,并生成數(shù)據(jù)文件數(shù)據(jù)量標識屬性;
具體獲取數(shù)據(jù)的組件對每個批次的所有數(shù)據(jù)文件都進行編碼,并將每個數(shù)據(jù)文件都增加current.index和next.index屬性,從而生成數(shù)據(jù)文件序號標識,用于標識數(shù)據(jù)文件的順序,以便在多線程并發(fā)處理后重新排序;
根據(jù)數(shù)據(jù)的類別不同添加不同的屬性,生成所述數(shù)據(jù)文件數(shù)據(jù)量標識屬性,用于標識數(shù)據(jù)文件中數(shù)據(jù)的量;
數(shù)據(jù)量結(jié)構(gòu)化數(shù)據(jù)添加resultCount屬性,二進制數(shù)據(jù)則添加file.size屬性;
第三步,將數(shù)據(jù)文件進行分塊處理
當數(shù)據(jù)進入到NiFi集群后存在數(shù)據(jù)處理場景時,在數(shù)據(jù)處理過程中將一個帶有current.index變量的數(shù)據(jù)文件拆分成多個數(shù)據(jù)文件;
在數(shù)據(jù)文件中增加拆分序號標識FragmentNumber和NextFragmentNumber,并更新數(shù)據(jù)文件FlowFile的數(shù)據(jù)量標識屬性resultCount;
第四步,將數(shù)據(jù)文件進行重新排序;
數(shù)據(jù)文件經(jīng)過并發(fā)處理或者進行分塊之后,數(shù)據(jù)文件FlowFile順序會有變動,針對對數(shù)據(jù)順序敏感的增量數(shù)據(jù)流程,將亂序的FlowFile數(shù)據(jù)文件根據(jù)數(shù)據(jù)文件序號標識和分塊標識值進行重新排序;
第五步,數(shù)據(jù)入庫
根據(jù)數(shù)據(jù)類型和目標庫不同,選用不同的數(shù)據(jù)加載組件,對數(shù)據(jù)進行加載;
第六步,數(shù)據(jù)完整性判斷及數(shù)據(jù)量統(tǒng)計
使用BitMap方式存儲同一批次數(shù)據(jù)文件所有接收到的FlowFile Index和Fragment相關屬性值;根據(jù)同一批次數(shù)據(jù)文件的flowFlag標識值,判斷該批次的所有數(shù)據(jù)文件是否全部接收完畢;若全部接收完畢,則利用EndFlow組件統(tǒng)計該批次同步數(shù)據(jù)文件的數(shù)量。
2.根據(jù)權(quán)利要求1所述的NiFi同步數(shù)據(jù)量統(tǒng)計方法,其特征在于:所述第一步中,通過StartFlow組件來生成NiFi數(shù)據(jù)文件批次標識;所述NiFi數(shù)據(jù)文件批次標識對應的數(shù)據(jù)文件屬性為flowFlag,相同的批次標識對應同一個批次的NiFi數(shù)據(jù)文件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮云信息技術(shù)股份公司,未經(jīng)浪潮云信息技術(shù)股份公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110001764.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種ApacheNiFi在源數(shù)據(jù)錄入數(shù)據(jù)庫方面的擴展應用方法和系統(tǒng)
- 一種基于NiFi的大數(shù)據(jù)計算方法及裝置
- 一種基于NiFi的數(shù)據(jù)采集方法
- 一種數(shù)據(jù)處理方法、裝置、設備及介質(zhì)
- 一種用于NIFI任務的分布式監(jiān)控系統(tǒng)及方法
- 一種基于NiFi的大數(shù)據(jù)量非結(jié)構(gòu)文件采集方法及系統(tǒng)
- 基于NiFi的數(shù)據(jù)處理方法和裝置
- 一種基于分布式架構(gòu)的空間數(shù)據(jù)轉(zhuǎn)換方法
- 一種NiFi同步數(shù)據(jù)量統(tǒng)計方法
- 一種基于NiFi更新Delta Lake的方法
- 統(tǒng)計系統(tǒng)、統(tǒng)計裝置和統(tǒng)計方法
- 人數(shù)統(tǒng)計方法和人數(shù)統(tǒng)計系統(tǒng)
- 統(tǒng)計物體數(shù)量的統(tǒng)計系統(tǒng)
- 網(wǎng)絡處理器的統(tǒng)計計數(shù)方法
- 統(tǒng)計信息上報方法及裝置
- 稿件統(tǒng)計方法和稿件統(tǒng)計系統(tǒng)
- 數(shù)據(jù)統(tǒng)計方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計狀態(tài)的方法及裝置
- 信息統(tǒng)計方法和信息統(tǒng)計裝置
- 電量統(tǒng)計系統(tǒng)及電量統(tǒng)計方法





