[發(fā)明專利]大數(shù)據(jù)采集方法、裝置以及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201510869746.0 | 申請(qǐng)日: | 2015-12-02 |
| 公開(公告)號(hào): | CN106817314B | 公開(公告)日: | 2020-03-20 |
| 發(fā)明(設(shè)計(jì))人: | 趙勇 | 申請(qǐng)(專利權(quán))人: | 中國(guó)電信股份有限公司 |
| 主分類號(hào): | H04L12/801 | 分類號(hào): | H04L12/801;H04L12/803 |
| 代理公司: | 中國(guó)國(guó)際貿(mào)易促進(jìn)委員會(huì)專利商標(biāo)事務(wù)所 11038 | 代理人: | 方亮 |
| 地址: | 100033 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 采集 方法 裝置 以及 系統(tǒng) | ||
本發(fā)明公開一種大數(shù)據(jù)采集方法、裝置以及系統(tǒng),涉及移動(dòng)通信領(lǐng)域,其中該方法包括:接收待上傳數(shù)據(jù)的采集客戶端發(fā)送的連接請(qǐng)求;根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間;將所述延時(shí)連接時(shí)間返回給采集客戶端,以便所述采集客戶端經(jīng)過所述延時(shí)連接時(shí)間后向采集服務(wù)器上傳數(shù)據(jù)。本發(fā)明提供的方法、裝置以及系統(tǒng),在一定程度上解決了網(wǎng)絡(luò)數(shù)據(jù)采集過程中出現(xiàn)的瞬時(shí)數(shù)據(jù)量過大的情況,在負(fù)載均衡技術(shù)的基礎(chǔ)上,引入了時(shí)間參數(shù),并通過元啟發(fā)式算法較好的協(xié)調(diào)了兩個(gè)維度的關(guān)系,使流量較為均衡地分布在各個(gè)時(shí)間段,最大限度地利用了現(xiàn)有資源。
技術(shù)領(lǐng)域
本發(fā)明涉及移動(dòng)通信領(lǐng)域,尤其涉及一種大數(shù)據(jù)采集方法、裝置以及系統(tǒng)。
背景技術(shù)
為捕捉用戶的使用行為信息,進(jìn)行有效分析,用準(zhǔn)確量化的數(shù)據(jù)作為產(chǎn)品創(chuàng)新及優(yōu)化,中國(guó)電信開發(fā)了基地業(yè)務(wù)量化分析系統(tǒng),該系統(tǒng)基于客戶端外掛程序的方式來進(jìn)行用戶數(shù)據(jù)采集,由于目前該系統(tǒng)的采集樣本量已經(jīng)突破1億,每日上報(bào)數(shù)據(jù)超過30G,即使已經(jīng)采用了軟硬件負(fù)載均衡技術(shù),但是依然會(huì)出現(xiàn)在一些時(shí)間負(fù)載很低,但在另一些瞬間會(huì)出現(xiàn)網(wǎng)絡(luò)堵塞的情況。
因此,有必要提出一種在大數(shù)據(jù)采集的時(shí)候可自行調(diào)整參數(shù)的大數(shù)據(jù)采集裝置和實(shí)現(xiàn)方法。
發(fā)明內(nèi)容
本公開要解決的一個(gè)技術(shù)問題是如何提供一種可自行調(diào)整參數(shù)的大數(shù)據(jù)采集裝置和實(shí)現(xiàn)方法。
本公開提供一種大數(shù)據(jù)采集方法,包括:接收待上傳數(shù)據(jù)的采集客戶端發(fā)送的連接請(qǐng)求;根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間;將所述延時(shí)連接時(shí)間返回給采集客戶端,以便所述采集客戶端經(jīng)過所述延時(shí)連接時(shí)間后向采集服務(wù)器上傳數(shù)據(jù)。
進(jìn)一步地,所述采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況包括網(wǎng)絡(luò)流量負(fù)載情況和帶寬情況。
進(jìn)一步地,所述根據(jù)采集服務(wù)器的當(dāng)前網(wǎng)絡(luò)情況基于啟發(fā)式算法計(jì)算所述采集客戶端的延時(shí)連接時(shí)間包括:隨機(jī)初始化時(shí)間T0;根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇時(shí)間Tt;比較采用當(dāng)前時(shí)間T0的流量峰值與平均值之差、時(shí)間Tt時(shí)的流量峰值與平均值之差;如果流量峰值與平均值之差不小于當(dāng)前時(shí)間T0時(shí)的情況,則計(jì)算更新時(shí)間,其中,更新時(shí)間的計(jì)算公式為Snew=Scur+sqrt(Tt)*randn,其中所述Scur為當(dāng)前請(qǐng)求上傳時(shí)間,Snew為更新上傳時(shí)間,randn為高斯隨機(jī)數(shù);將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端。
進(jìn)一步地,如果采用時(shí)間Tt時(shí),流量峰值與平均值之差小于時(shí)間T0時(shí)的流量峰值與平均值之差,則將Tt更新T0,并重新根據(jù)當(dāng)前的網(wǎng)絡(luò)流量負(fù)載的分布,選擇一個(gè)新的時(shí)間Tt。
進(jìn)一步地,判斷當(dāng)前循環(huán)次數(shù),如果當(dāng)前循環(huán)次數(shù)不大于第一設(shè)定閾值時(shí),如果采用時(shí)間段Tt時(shí)流量峰值與平均值之差沒有小于時(shí)間段T0的流量峰值與平均值之差的情況,計(jì)算接受概率P,其中P=1/(1+exp(Δ/Tt)),其中Δ為時(shí)間段T0、時(shí)間段Tt時(shí)流量峰值與平均值之差的差值;如果所述接受概率不小于第二設(shè)定閾值,計(jì)算更新時(shí)間并將所述更新時(shí)間作為延時(shí)連接時(shí)間發(fā)送給采集客戶端。
進(jìn)一步地,如果當(dāng)前循環(huán)次數(shù)大于第一設(shè)定閾值且未得到接受概率小于第二設(shè)定閾值的時(shí)間,則退出當(dāng)前的循環(huán)計(jì)算延時(shí)連接時(shí)間的過程并確定未得到延時(shí)連接時(shí)間;向采集客戶端返回?cái)?shù)據(jù)上傳響應(yīng)以便所述采集客戶端向服務(wù)器上傳數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)電信股份有限公司,未經(jīng)中國(guó)電信股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510869746.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





