[發(fā)明專利]數(shù)據(jù)采集系統(tǒng)、方法、節(jié)點(diǎn)設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201810515496.4 | 申請(qǐng)日: | 2018-05-25 |
| 公開(kāi)(公告)號(hào): | CN110597890B | 公開(kāi)(公告)日: | 2022-04-05 |
| 發(fā)明(設(shè)計(jì))人: | 郭峰 | 申請(qǐng)(專利權(quán))人: | 杭州??低晹?shù)字技術(shù)股份有限公司 |
| 主分類號(hào): | G06F16/25 | 分類號(hào): | G06F16/25 |
| 代理公司: | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11138 | 代理人: | 韓東艷 |
| 地址: | 310051 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 采集 系統(tǒng) 方法 節(jié)點(diǎn) 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開(kāi)了一種數(shù)據(jù)采集系統(tǒng)、方法、節(jié)點(diǎn)設(shè)備及存儲(chǔ)介質(zhì),屬于大數(shù)據(jù)技術(shù)領(lǐng)域。數(shù)據(jù)采集系統(tǒng)包括多個(gè)數(shù)據(jù)處理模塊;數(shù)據(jù)采集系統(tǒng)中第一個(gè)數(shù)據(jù)處理模塊用于當(dāng)獲取到數(shù)據(jù)源的任一批數(shù)據(jù)時(shí),指示數(shù)據(jù)源提供下一批數(shù)據(jù);數(shù)據(jù)采集系統(tǒng)中任一個(gè)數(shù)據(jù)處理模塊用于對(duì)已接收到的任一批數(shù)據(jù)執(zhí)行對(duì)應(yīng)的數(shù)據(jù)處理操作時(shí),接收下一批數(shù)據(jù);數(shù)據(jù)采集系統(tǒng)中最后一個(gè)數(shù)據(jù)處理模塊用于將處理后的數(shù)據(jù)存儲(chǔ)至第一存儲(chǔ)源中。本發(fā)明設(shè)計(jì)了全異步式的系統(tǒng)架構(gòu),保證數(shù)據(jù)采集系統(tǒng)可以同時(shí)針對(duì)多批數(shù)據(jù)進(jìn)行處理,避免數(shù)據(jù)處理模塊要等待其他數(shù)據(jù)處理模塊執(zhí)行數(shù)據(jù)處理操作完成后才能開(kāi)始處理數(shù)據(jù)的情況,提高了數(shù)據(jù)采集的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)采集系統(tǒng)、方法、節(jié)點(diǎn)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著大數(shù)據(jù)技術(shù)的發(fā)展以及網(wǎng)絡(luò)中海量數(shù)據(jù)的飛速增長(zhǎng),數(shù)據(jù)采集的挑戰(zhàn)變得尤為突出。數(shù)據(jù)采集是指對(duì)數(shù)據(jù)源中的數(shù)據(jù)經(jīng)過(guò)一系列的處理操作,最終將處理操作后的數(shù)據(jù)存儲(chǔ)至存儲(chǔ)源的過(guò)程。通過(guò)進(jìn)行數(shù)據(jù)采集,可以幫助人們管理、分析和挖掘數(shù)據(jù),具有巨大的經(jīng)濟(jì)和應(yīng)用價(jià)值。
目前數(shù)據(jù)采集系統(tǒng)通常采用單機(jī)多線程的架構(gòu),基于同步方式進(jìn)行數(shù)據(jù)采集:數(shù)據(jù)采集系統(tǒng)包括多個(gè)線程,每個(gè)線程用于執(zhí)行一種數(shù)據(jù)處理操作,在數(shù)據(jù)采集的過(guò)程中,當(dāng)數(shù)據(jù)源提供了一批數(shù)據(jù)時(shí),第一個(gè)線程從數(shù)據(jù)源拉取這批數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行處理后,將處理后的數(shù)據(jù)發(fā)送給第二個(gè)線程,第二個(gè)線程接收第一個(gè)線程的數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行處理后,將處理后的數(shù)據(jù)發(fā)送給第三個(gè)線程,依次類推,最后一個(gè)線程接收數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行處理后,會(huì)將處理后的數(shù)據(jù)存儲(chǔ)至存儲(chǔ)源中。之后,最后一個(gè)線程會(huì)通知數(shù)據(jù)源其提供的這批數(shù)據(jù)已經(jīng)成功存儲(chǔ)入庫(kù),數(shù)據(jù)源得到通知后,會(huì)提供下一批數(shù)據(jù),則第一個(gè)線程會(huì)繼續(xù)會(huì)從數(shù)據(jù)源拉取下一批數(shù)據(jù),依次類推。
在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)明人發(fā)現(xiàn)相關(guān)技術(shù)至少存在以下問(wèn)題:
任一時(shí)刻整個(gè)數(shù)據(jù)采集系統(tǒng)只能針對(duì)一批數(shù)據(jù)進(jìn)行處理,每個(gè)線程均要等待其他線程處理這批數(shù)據(jù)完畢后才能開(kāi)始接收并處理下一批數(shù)據(jù),數(shù)據(jù)采集的效率極低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)采集系統(tǒng)、方法、節(jié)點(diǎn)設(shè)備及存儲(chǔ)介質(zhì),可以解決相關(guān)技術(shù)中數(shù)據(jù)采集的效率極低的問(wèn)題。所述技術(shù)方案如下:
一方面,提供了一種數(shù)據(jù)采集系統(tǒng),所述數(shù)據(jù)采集系統(tǒng)包括多個(gè)數(shù)據(jù)處理模塊;
所述數(shù)據(jù)采集系統(tǒng)中第一個(gè)數(shù)據(jù)處理模塊用于當(dāng)獲取到數(shù)據(jù)源的任一批數(shù)據(jù)時(shí),指示所述數(shù)據(jù)源提供下一批數(shù)據(jù);
所述數(shù)據(jù)采集系統(tǒng)中任一個(gè)數(shù)據(jù)處理模塊用于對(duì)已接收到的任一批數(shù)據(jù)執(zhí)行對(duì)應(yīng)的數(shù)據(jù)處理操作時(shí),接收下一批數(shù)據(jù);
所述數(shù)據(jù)采集系統(tǒng)中最后一個(gè)數(shù)據(jù)處理模塊用于將處理后的數(shù)據(jù)存儲(chǔ)至第一存儲(chǔ)源中。
在一種可能的設(shè)計(jì)中,所述數(shù)據(jù)采集系統(tǒng)中任一個(gè)數(shù)據(jù)處理模塊具有對(duì)應(yīng)的內(nèi)存空間,所述內(nèi)存空間用于緩存已接收到的數(shù)據(jù);
所述數(shù)據(jù)采集系統(tǒng)中任一個(gè)數(shù)據(jù)處理模塊還用于對(duì)已接收到的任一批數(shù)據(jù)執(zhí)行對(duì)應(yīng)的數(shù)據(jù)處理操作時(shí),將接收到的下一批數(shù)據(jù)緩存至所述任一個(gè)數(shù)據(jù)處理模塊的內(nèi)存空間中,當(dāng)處理所述任一批數(shù)據(jù)完成后,從所述內(nèi)存空間中讀取所述下一批數(shù)據(jù)。
在一種可能的設(shè)計(jì)中,所述數(shù)據(jù)采集系統(tǒng)還包括至少一個(gè)共享內(nèi)存池,每個(gè)共享內(nèi)存池用于為對(duì)應(yīng)的多個(gè)數(shù)據(jù)處理模塊提供內(nèi)存空間。
在一種可能的設(shè)計(jì)中,所述任一個(gè)數(shù)據(jù)處理模塊還用于從對(duì)應(yīng)的共享內(nèi)存池中申請(qǐng)內(nèi)存空間,當(dāng)申請(qǐng)得到的內(nèi)存空間使用完畢后,將所述申請(qǐng)得到的內(nèi)存空間釋放回所述共享內(nèi)存池中。
在一種可能的設(shè)計(jì)中,所述數(shù)據(jù)采集系統(tǒng)中任一個(gè)數(shù)據(jù)處理模塊的內(nèi)存空間包括堆內(nèi)內(nèi)存;
所述任一個(gè)數(shù)據(jù)處理模塊還用于將處理后的數(shù)據(jù)推送至下一個(gè)數(shù)據(jù)處理模塊的堆內(nèi)內(nèi)存中。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州??低晹?shù)字技術(shù)股份有限公司,未經(jīng)杭州海康威視數(shù)字技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810515496.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





