[發(fā)明專利]一種大數(shù)據(jù)的數(shù)據(jù)采集方法在審
| 申請?zhí)枺?/td> | 202011244625.4 | 申請日: | 2020-11-10 |
| 公開(公告)號(hào): | CN112269902A | 公開(公告)日: | 2021-01-26 |
| 發(fā)明(設(shè)計(jì))人: | 龔波;蘇學(xué)武;水軍;楊剛;蘇文輝 | 申請(專利權(quán))人: | 珠海市新德匯信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/835 | 分類號(hào): | G06F16/835;G06F16/838;G06F16/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 519000 廣東省珠*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 數(shù)據(jù) 采集 方法 | ||
1.一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,包括以下步驟:
S1、基于可視化流程編排平臺(tái),統(tǒng)一處理不同類型的數(shù)據(jù);所述步驟S1具體包括以下步驟:
S11、構(gòu)建設(shè)計(jì)態(tài)平臺(tái);
S12、針對不同類型的數(shù)據(jù)定制不同的接入組件;
S13、預(yù)置接入組件;預(yù)置的接入組件能夠被動(dòng)監(jiān)聽實(shí)時(shí)流數(shù)據(jù)、主動(dòng)拉取靜態(tài)數(shù)據(jù)、對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行轉(zhuǎn)換;
S2、基于可視化流程編排平臺(tái),統(tǒng)一編排數(shù)據(jù)對賬、數(shù)據(jù)質(zhì)量檢測公共流程;所述步驟S2具體包括以下步驟:
S21、在能夠主動(dòng)獲取源數(shù)據(jù)和目的數(shù)據(jù)的節(jié)點(diǎn),編排數(shù)據(jù)對賬組件及流程;
S22、在能夠主動(dòng)拉取數(shù)據(jù)的節(jié)點(diǎn),編排數(shù)據(jù)質(zhì)量檢測組件及流程,重用接入組件的數(shù)據(jù)獲取能力,對數(shù)據(jù)源進(jìn)行質(zhì)量抽取和檢測。
2.根據(jù)權(quán)利要求1所述的一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,所述設(shè)計(jì)態(tài)平臺(tái)能夠支持設(shè)計(jì)態(tài)與運(yùn)行態(tài)分離。
3.根據(jù)權(quán)利要求1所述的一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,所述步驟S12中,設(shè)計(jì)態(tài)平臺(tái)定義接入組件的定制規(guī)范,允許二次擴(kuò)展接入組件;
步驟S12包括以下步驟:
S121、針對不同場景對做接入組件適配,屏蔽獲取模式或通信協(xié)議的差異,生成協(xié)議中立的報(bào)文;
S122、采用系統(tǒng)封裝通用機(jī)制供各接入組件調(diào)用,將獲取到的數(shù)據(jù),以批量方式統(tǒng)一推送到Kafka集群。
4.根據(jù)權(quán)利要求1所述的一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,所述步驟S13中,被動(dòng)監(jiān)聽實(shí)時(shí)流數(shù)據(jù),是以Syslog或Restful接口接收到高速實(shí)時(shí)流數(shù)據(jù)后,去除協(xié)議相關(guān)的語法,解析成規(guī)整的結(jié)構(gòu)化數(shù)據(jù),批量提交到kafka集群削峰,然后由實(shí)時(shí)流處理引擎統(tǒng)一加工處理。
5.根據(jù)權(quán)利要求1所述的一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,所述步驟S13中,主動(dòng)拉取靜態(tài)數(shù)據(jù),是以增量方式從JDBC、kafka數(shù)據(jù)源批量抽取數(shù)據(jù),得到規(guī)整的結(jié)構(gòu)化數(shù)據(jù),批量提交到Kafka集群,然后由實(shí)時(shí)流處理引擎統(tǒng)一加工處理。
6.根據(jù)權(quán)利要求1所述的一種大數(shù)據(jù)的數(shù)據(jù)采集方法,其特征在于,所述步驟S13中,對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行轉(zhuǎn)換,是由前置智能分析處理器把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為規(guī)整的結(jié)構(gòu)化數(shù)據(jù),推送到Kafka集群,然后由實(shí)時(shí)流處理引擎統(tǒng)一加工處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海市新德匯信息技術(shù)有限公司,未經(jīng)珠海市新德匯信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011244625.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種金屬熔煉爐
- 下一篇:一種鋰電池保護(hù)組件
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





