[發(fā)明專利]一種Kafka數(shù)據(jù)處理的方法和服務(wù)器在審

申請?zhí)枺?/td>	202010743890.0	申請日：	2020-07-29
公開（公告）號：	CN112000489A	公開（公告）日：	2020-11-27
發(fā)明（設(shè)計）人：	王鑫	申請（專利權(quán)）人：	新華三大數(shù)據(jù)技術(shù)有限公司
主分類號：	G06F9/54	分類號：	G06F9/54
代理公司：	暫無信息	代理人：	暫無信息
地址：	450000 河南省鄭州市鄭州高***	國省代碼：	河南;41
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種 kafka 數(shù)據(jù)處理方法服務(wù)器
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本說明書提供一種Kafka數(shù)據(jù)處理的方法和服務(wù)器，該方法包括：獲取待處理數(shù)據(jù)，以及所述待處理數(shù)據(jù)對應的第一消息偏移量Offset，將所述待處理數(shù)據(jù)、第一Offset加載到共享消息隊列，當確定處理完所述共享消息隊列中的數(shù)據(jù)后，將生成的第二Offset發(fā)送給ZooKeeper組件。通過該方法，可以實現(xiàn)先處理待處理數(shù)據(jù)，在向ZooKeeper提交Offset，避免因Consumer出現(xiàn)內(nèi)存溢出或者所在服務(wù)器宕機導致向ZooKeeper提交的Offset與Consumer實際處理的數(shù)據(jù)不一致。

技術(shù)領(lǐng)域

本公開涉及大數(shù)據(jù)領(lǐng)域，尤其涉及一種Kafka數(shù)據(jù)處理的方法和服務(wù)器。

背景技術(shù)

近幾年由于大數(shù)據(jù)時代的到來，互聯(lián)網(wǎng)以及移動互聯(lián)網(wǎng)業(yè)務(wù)的數(shù)據(jù)成倍的增長，大數(shù)據(jù)對于數(shù)據(jù)準確性需求也在逐步上升。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫和數(shù)據(jù)傳輸方式漸漸無法滿足用戶對數(shù)據(jù)準確性的需求。

Kafka架構(gòu)設(shè)計原理：

在Kafka的消費者(Consumer)中，有一個很關(guān)鍵的機制那就是消息偏移量(Offset)機制。在有了消息偏移量(Offset)機制后，即使Kafka在消費的過程中發(fā)生異常，或者引發(fā)再均衡重新分配分區(qū)的問題，在重新恢復消費時候也可以知道從哪個位置開始消費。

在Kafka里面的消息偏移量(Offset)是用來記錄消息在主題(topic)中消費進度的標志，消息偏移量(Offset)在分區(qū)中的是根據(jù)消息到達時間的順序而遞增的。在Consumer中，對于位置消息偏移量(Offset)的處理是在Consumer建立連接的時候，定時將現(xiàn)有用戶的在每個分區(qū)的消息偏移量(Offset)記錄到ZooKeeper組件中。所以每次consumer啟動的時候都要先從ZooKeeper組件中讀取記錄的Offset作為本次消費的起始點。

發(fā)明內(nèi)容

本說明書實施例提供了一種Kafka數(shù)據(jù)處理的方法和服務(wù)器，可以實現(xiàn)先處理待處理數(shù)據(jù)，在向ZooKeeper提交Offset，避免因Consumer出現(xiàn)內(nèi)存溢出或者所在服務(wù)器宕機導致向ZooKeeper提交的Offset與Consumer實際處理的數(shù)據(jù)不一致。

本說明實施例提供了一種Kafka數(shù)據(jù)處理的方法，該方法包括：

獲取待處理數(shù)據(jù)，以及所述待處理數(shù)據(jù)對應的第一消息偏移量Offset；

將所述待處理數(shù)據(jù)、第一Offset加載到共享消息隊列；

當確定處理完所述共享消息隊列中的數(shù)據(jù)后，將生成的第二Offset發(fā)送給ZooKeeper組件。

通過上述實施例可以看出，在根據(jù)第一Offset和待處理數(shù)據(jù)處理共享消息隊列時，可獲知共享消息隊列的處理完成情況，當確定處理完成時，將生成的第二Offset發(fā)送給ZooKeeper組件，以使ZooKeeper組件保存的Offset與實際對待處理數(shù)據(jù)處理的結(jié)果一致。

可選的，通過Kafka組件獲取所述待處理數(shù)據(jù)，并對所述待處理數(shù)據(jù)加載用于唯一標識所述待處理數(shù)據(jù)的ID標識。

可選的，從ZooKeeper組件中獲取與所述待處理數(shù)據(jù)對應的第一Offset，并將所述第一Offset作為起始Offset。

可選的，根據(jù)所述待處理數(shù)據(jù)、第一Offset構(gòu)造消息數(shù)據(jù)，將所述消息數(shù)據(jù)加載在共享消息隊列中。

可選的，將所述共享消息隊列中的第一Offset刪除，并生成第二Offset；

將所述第二Offset發(fā)送給ZooKeeper組件。

本說明書實施例還提供了一種服務(wù)器，所述服務(wù)器運行有Kafka組件，所述服務(wù)器包括：

獲取模塊，用于獲取待處理數(shù)據(jù)，以及所述待處理數(shù)據(jù)對應的第一消息偏移量Offset；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華三大數(shù)據(jù)技術(shù)有限公司，未經(jīng)新華三大數(shù)據(jù)技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010743890.0/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06F 電數(shù)字數(shù)據(jù)處理
G06F9-00 程序控制裝置，例如，控制器
G06F9-02 .應用有線連接的，例如，插頭板
G06F9-04 .應用僅含程序指令的記錄載體的
G06F9-06 .應用存入的程序的，即應用處理設(shè)備的內(nèi)部存儲來接收程序并保持程序的
G06F9-22 ..微控制或微程序裝置
G06F9-30 ..執(zhí)行機器指令的裝置，例如指令譯碼

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】