[發明專利]一種大規模流式集合數據的分布式處理方法有效
| 申請號: | 201710087603.3 | 申請日: | 2017-02-17 |
| 公開(公告)號: | CN106990913B | 公開(公告)日: | 2019-07-26 |
| 發明(設計)人: | 王建民;龍明盛;王玨;黃向東 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 羅文群 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 大規模 集合 數據 分布式 處理 方法 | ||
1.一種大規模流式集合數據的分布式處理方法,其特征在于該處理方法包括以下步驟:
(1)監控系統從數據源接收集合數據,將接收的集合數據記為記當前分布式存儲系統的寫入隊列長度為wcurrent,分布式存儲系統的最大寫入隊列長度為wmax,對當前分布式存儲系統的寫入隊列長度進行判斷,若0<wcurrennt<wmax,則進入步驟(2);若wcurrent≥wmax,則監控系統將接收的集合數據寫入監控系統的磁盤,并記寫入磁盤的集合數據為sstore,繼續接收集合數據,重復本步驟,若wcurrent=0,則訪問磁盤上的sstore,并對磁盤上的sstore進行判斷,若sstore存在,則進入步驟(2),若sstore不存在,則重復本步驟;
(2)根據集合數據中的頭信息,所述頭信息為集合數據中的成員數n,監控系統對集合數據進行判斷,記接收的集合數據當前到達的成員數為scurrent,若scurrent=n,則監控系統將集合數據存儲到分布式存儲系統中,進入步驟(3),若scurrent<n,則返回步驟(1);
(3)監控系統將集合數據中在分布式存儲系統中的消息,所述消息為集合數據在分布式存儲系統中的表名與行、列位置,發送至分布式消息系統中,分布式消息系統將接收的消息寫入分布式消息系統的消息隊列Q中,記當前分布式消息系統隊列中的所有消息為Icurrent,設定一個消息隊列Q的長度閾值為Lmax,并記當前消息隊列的長度為Lcurrent,根據消息隊列Q的長度閾值Lmax,對消息隊列Q的長度進行判斷,若Lcurrent≥Lmax,則將Icurrent中的Lcurrent/2的消息存儲到分布式消息系統的磁盤中,并記存儲至磁盤中的消息為Istore,重復本步驟,若Lcurrent=0,則訪問分布式消息系統的磁盤,并對磁盤上的消息進行判斷,若磁盤上存在消息Istore,則將消息Istore寫入消息隊列Q中,重復本步驟,若磁盤上不存在消息Istore,則返回步驟(1),若Lmax>Lcurrent>0,則進行步驟(4);
(4)監控系統訪問分布式存儲系統,對分布式存儲系統的寫入隊列長度進行判斷,若wcurrent<wmax,進入步驟(5),若wcurrent≥wmax,重復本步驟;
(5)分布式計算系統從分布式消息系統隊列中Q中獲取消息,設定分布式計算系統最少處理的消息閾值為Lmin,獲取消息的時間閾值為tmmax,記當前獲取消息的等待時間為twait,對分布式消息系統中的消息隊列Q進行判斷,若分布式消息系統的消息隊列Q中Lcurrent≥Lmin,且twait≤tmax,則分布式計算系統從分布式消息系統的消息隊列Q中獲取消息,進入步驟(6),若分布式消息系統的隊列Q中Lcurrent<Lmin,或twait>tmax,則放棄本次獲取的消息,返回上述步驟(2);
(6)分布式計算系統根據獲取的消息,從分布式存儲系統中獲取相應的集合數據,并對從分布式存儲系統中獲取的集合數據進行判斷,若分布式存儲系統中存在與獲取的消息相對應的集合數據,則進行步驟(7),若分布式存儲系統中不存在與獲取的消息相對應的集合數據,則返回上述步驟(2);
(7)分布式計算系統根據步驟(6)獲得的集合數據,通過處理算法和業務邏輯對集合數據進行分布式的處理和計算,得到計算結果,并通知監控系統計算完成;
(8)記分布式計算系統寫入分布式存儲系統的最大等待時間為savemax,當前等待時間為savecurrent,監控系統對分布式計算系統寫入分布式存儲系統的等待時間進行判斷,若savecurrent≥savemax,則返回步驟(6),若savecurrent<savemax,則監控系統根據獲取的消息,將分布式計算結果存儲到分布式存儲系統的相應位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710087603.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





