[發明專利]一種海量數據處理方法、裝置及系統無效
| 申請號: | 201210346799.0 | 申請日: | 2012-09-18 |
| 公開(公告)號: | CN102902746A | 公開(公告)日: | 2013-01-30 |
| 發明(設計)人: | 李晨;馬向暉 | 申請(專利權)人: | 杭州勒卡斯廣告策劃有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;H04L29/08 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 310012 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海量 數據處理 方法 裝置 系統 | ||
技術領域
本申請涉及軟件技術領域,特別涉及一種海量數據處理方法、裝置及系統。
背景技術
海量數據一般是指數據量為PB級以上的數據。海量數據的處理,一般采用分布式處理方案,即將海量數據進行分片,分發至不同的節點進行處理,為保證數據的安全,通常采用數據冗余方案,即一份數據存在于多個節點上,此時,冗余的數據稱為數據副本。
目前,在對海量數據進行一次寫入處理時,需要系統對存儲有海量數據的每個數據副本執行寫入操作,即將待更新數據發送至每個數據副本,每個數據副本將待更新數據寫入到本數據副本中,從而保證海量數據的一致性。例如,當前數據有N個數據副本,在對當前數據進行寫入操作時,需要系統對該數據的N個數據副本均執行寫入操作,即執行N次寫入操作,使得系統對海量數據的處理效率較低。
同時,若數據副本中有一個數據副本寫入失敗,那么其他數據副本即使寫入成功,也均會回滾至被寫入之前的狀態,此時,需要系統重新對所有的數據副本再次執行寫入操作,從而明顯使得系統對海量數據的處理性能降低,嚴重影響海量數據的處理效率。
發明內容
有鑒于此,本申請通過提供一種海量數據處理方法、裝置及系統,用以解決現有技術中對多個同時存儲有海量數據的數據副本進行一次寫入處理時,需系統執行多次寫入操作,從而使得海量數據的處理效率降低的技術問題,以及用以解決現有海量數據處理方案中,一次寫入失敗,所有數據副本回滾,從而明顯使得系統對海量數據的處理性能降低,嚴重影響海量數據的處理效率的技術問題。
本申請提供了一種海量數據處理方法,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點;
其中,所述數據副本集群包括至少一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連,且所述數據節點在其預設時間間隔點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本;
所述方法包括:
依據預設規則在所述數據副本集群中被選取的當前數據節點接收待更新數據,并將所述待更新數據寫入至本數據節點;
其中,所述待更新數據在所述數據副本集群接收到的更新請求信息中提取;
并更新所述當前數據節點的數據版本;
若當前系統時間到達所述預設時間間隔點,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本。
上述方法,優選地,所述數據節點的數據版本包括被寫入數據的標識信息;
所述更新所述當前數據節點的數據版本包括:
將所述待更新數據的標識信息添加至所述當前數據節點的數據版本中。
上述方法,優選地,所述依據預設規則在所述數據副本集群中選取當前數據節點包括:
任意選取所述數據副本集群中的一個數據節點作為當前數據節點;
或選取所述數據副本集群中數據版本最大的數據節點作為當前數據節點。
上述方法,優選地,所述當前數據節點獲取本數據節點中不同于所述另一數據節點的數據,并將所述獲取的數據寫入至所述另一數據節點中,觸發所述另一數據節點更新其數據版本包括:
所述當前數據節點依據其數據版本生成同步請求信息,并將所述同步請求信息發送至所述另一數據節點;
其中,所述同步請求信息包括所述當前數據節點的數據版本;
所述另一數據節點依據其數據版本及所述當前數據節點的數據版本生成同步回復信息,并將所述同步回復信息發送至所述當前數據節點;
其中,所述同步回復信息包括所述當前數據節點中不同于所述另一數據節點的數據的標識信息;
所述當前數據節點提取與所述同步回復信息中的標識信息相對應的數據,并將所述提取的數據寫入至所述另一數據節點,觸發所述另一數據節點更新其數據版本。
本申請還提供了一種海量數據處理裝置,應用于預設的分布式數據副本集群中存儲有海量數據的數據節點;
其中,所述數據副本集群至少包括一個所述數據節點,所述每一數據節點至少與一個不同于本數據節點的另一數據節點相連;
所述裝置包括計時單元、第一寫入單元、第二寫入單元和版本更新單元,其中:
所述計時單元,用于實時判斷當前系統時間是否到達本數據節點的預設時間間隔點,如果是,觸發本數據節點的所述第一寫入單元;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州勒卡斯廣告策劃有限公司,未經杭州勒卡斯廣告策劃有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210346799.0/2.html,轉載請聲明來源鉆瓜專利網。





