[發(fā)明專利]一種Spark平臺中事件處理方法和裝置在審
| 申請?zhí)枺?/td> | 201811288881.6 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109471741A | 公開(公告)日: | 2019-03-15 |
| 發(fā)明(設(shè)計)人: | 韓東亮;龔紅祥 | 申請(專利權(quán))人: | 新華三大數(shù)據(jù)技術(shù)有限公司 |
| 主分類號: | G06F9/54 | 分類號: | G06F9/54 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11371 | 代理人: | 蘇勝 |
| 地址: | 450000 河南省鄭州市鄭州高新*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 事件實體 方法和裝置 結(jié)構(gòu)化數(shù)據(jù) 數(shù)據(jù)流 關(guān)聯(lián)引擎 事件處理 數(shù)據(jù)處理技術(shù) 復(fù)雜事件 關(guān)聯(lián)分析 關(guān)聯(lián)規(guī)則 實時計算 提取事件 消息隊列 推斷 寫入 發(fā)送 關(guān)聯(lián) 輸出 緩解 | ||
本發(fā)明提供了一種Spark平臺中事件處理方法和裝置,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,該方法包括:從消息隊列中提取事件實體;將事件實體處理為結(jié)構(gòu)化數(shù)據(jù);將處理為結(jié)構(gòu)化數(shù)據(jù)的事件實體發(fā)送至關(guān)聯(lián)引擎;關(guān)聯(lián)引擎將接收到的事件實體寫入對應(yīng)的事件類中,并根據(jù)關(guān)聯(lián)規(guī)則對各事件類中的事件實體進行關(guān)聯(lián)計算,輸出復(fù)雜事件。本發(fā)明緩解了現(xiàn)有的實時計算框架Spark Steaming無法對數(shù)據(jù)流進行關(guān)聯(lián)分析以從數(shù)據(jù)流中推斷出新數(shù)據(jù)的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)處理的技術(shù)領(lǐng)域,尤其是涉及一種Spark平臺中事件處理方法和裝置。
背景技術(shù)
實時計算框架Spark Steaming是Spark API(Application ProgrammingInterface,應(yīng)用程序編程接口)的一個擴展。實時計算框架Spark Steaming 不能像流式處理框架Storm一樣事件來一條處理一條。實時計算框架Spark Streaming將流式計算分解成一系列短小的批處理作業(yè),處理的引擎是Spark Core。Spark Core將實時計算框架SparkStreaming的輸入數(shù)據(jù)按照批尺寸batch size生成一個個離散數(shù)據(jù)流(DStream,Discretized Stream)。
但是,在現(xiàn)有技術(shù)中,實時計算框架Spark Steaming無法從離散數(shù)據(jù)流DStream中獲得更多有價值的事件。獲得更多有價值的事件是指找到離散數(shù)據(jù)流DStream中事件之間的關(guān)系,進而根據(jù)該關(guān)系推斷新的數(shù)據(jù)。
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)處理不僅僅是對數(shù)據(jù)進行簡單的分析、存儲等操作,從大量的數(shù)據(jù)流中提取更多有價值的數(shù)據(jù)顯得尤為重要。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種Spark平臺中事件處理方法和裝置,以緩解了現(xiàn)有的實時計算框架Spark Steaming無法對數(shù)據(jù)流進行關(guān)聯(lián)分析以從數(shù)據(jù)流中推斷出新數(shù)據(jù)的技術(shù)問題。
第一方面,本發(fā)明實施例提供了一種Spark平臺中事件處理方法,應(yīng)用于SparkStreaming節(jié)點,所述Spark Streaming節(jié)點中集成有關(guān)聯(lián)引擎,包括:從消息隊列中提取事件實體;將所述事件實體處理為結(jié)構(gòu)化數(shù)據(jù);將處理為結(jié)構(gòu)化數(shù)據(jù)的事件實體發(fā)送至所述關(guān)聯(lián)引擎;所述關(guān)聯(lián)引擎將接收到的事件實體寫入對應(yīng)的事件類中,并根據(jù)關(guān)聯(lián)規(guī)則對各事件類中的事件實體進行關(guān)聯(lián)計算,輸出復(fù)雜事件。
進一步地,所述關(guān)聯(lián)引擎將接收到的事件實體寫入對應(yīng)的事件類中包括:在各事件類中查找與所述接收到的事件實體相對應(yīng)的事件類;若查找到所述相對應(yīng)的事件類,則將所述接收到的事件實體寫入對應(yīng)的事件類中;若未查找到所述相對應(yīng)的事件類,則創(chuàng)建新的事件類,并將所述接收到的事件實體寫入所述新的事件類中。
進一步地,將所述處理為結(jié)構(gòu)化數(shù)據(jù)的事件實體發(fā)送至所述關(guān)聯(lián)引擎時,該方法還包括:所述關(guān)聯(lián)引擎按照第一預(yù)設(shè)規(guī)則對所述接收到的事件實體進行過濾,將過濾后的事件實體寫入所述對應(yīng)的事件類。
進一步地,該方法還包括:所述關(guān)聯(lián)引擎將過濾后事件實體送入事件窗口。
進一步地,所述關(guān)聯(lián)引擎根據(jù)關(guān)聯(lián)規(guī)則對各事件類中的事件實體進行關(guān)聯(lián)計算,輸出復(fù)雜事件包括:所述關(guān)聯(lián)引擎根據(jù)第二預(yù)設(shè)規(guī)則觸發(fā)監(jiān)聽事件;所述監(jiān)聽事件為針對觸發(fā)時刻對應(yīng)的事件窗口中包含的事件實體根據(jù)關(guān)聯(lián)規(guī)則進行關(guān)聯(lián)計算,輸出復(fù)雜事件。
第二方面,本發(fā)明實施例提供了一種Spark平臺中事件處理裝置,設(shè)置于SparkStreaming節(jié)點,包括提取單元、數(shù)據(jù)轉(zhuǎn)化單元、發(fā)送單元和關(guān)聯(lián)引擎,其中:所述提取單元,用于從消息隊列中提取事件實體;所述數(shù)據(jù)轉(zhuǎn)化單元,用于將所述事件實體處理為結(jié)構(gòu)化數(shù)據(jù);所述發(fā)送單元,用于將處理為結(jié)構(gòu)化數(shù)據(jù)的事件實體發(fā)送至所述關(guān)聯(lián)引擎;所述關(guān)聯(lián)引擎,用于將接收到的事件實體寫入對應(yīng)的事件類中,并根據(jù)關(guān)聯(lián)規(guī)則對各事件類中的事件實體進行關(guān)聯(lián)計算,輸出復(fù)雜事件。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于新華三大數(shù)據(jù)技術(shù)有限公司,未經(jīng)新華三大數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811288881.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于所接收的與網(wǎng)絡(luò)實體相關(guān)聯(lián)的事件來構(gòu)造貝葉斯網(wǎng)絡(luò)
- 事件處理方法及裝置
- 用戶面事件處理方法、PCRF實體和AF實體
- 通信網(wǎng)絡(luò)的網(wǎng)絡(luò)實體
- 一種本體構(gòu)建方法及裝置
- 一種信息處理方法、裝置及計算機可讀存儲介質(zhì)
- 一種知識圖譜的擴展方法、裝置、存儲介質(zhì)和計算設(shè)備
- 事件實體聯(lián)合抽取方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 一種對突發(fā)事件的實體信息進行抽取的方法與設(shè)備
- 基于新聞事件的關(guān)系分析方法及裝置
- 結(jié)構(gòu)化元數(shù)據(jù)的合并方法、傳輸方法以及分割方法
- 一種電力行業(yè)非結(jié)構(gòu)化元數(shù)據(jù)關(guān)聯(lián)方法及系統(tǒng)
- 一種將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的方法及裝置
- 業(yè)務(wù)項目的風(fēng)險識別方法及裝置
- 一種基于事件的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)采集系統(tǒng)
- 結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)查詢方法、設(shè)備、存儲介質(zhì)及裝置
- 信息關(guān)聯(lián)方法、裝置、設(shè)備及存儲介質(zhì)
- 非結(jié)構(gòu)化數(shù)據(jù)存儲方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的存儲方法、裝置、設(shè)備及介質(zhì)
- 一種融合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的混合搜索方法
- 編碼裝置,編碼方法,程序和記錄媒體
- 網(wǎng)絡(luò)數(shù)據(jù)流識別系統(tǒng)及方法
- 一種數(shù)據(jù)流調(diào)度的方法、設(shè)備和系統(tǒng)
- 一種確定待清洗數(shù)據(jù)流的方法及裝置
- 用于分析儀器化軟件的數(shù)據(jù)流處理語言
- 用于數(shù)據(jù)流系統(tǒng)的數(shù)據(jù)流處理方法及裝置
- 數(shù)據(jù)流調(diào)度系統(tǒng)以及數(shù)據(jù)流調(diào)度方法
- 采用向量處理的同時分割
- 汽車數(shù)據(jù)流的監(jiān)控方法、系統(tǒng)及可讀存儲介質(zhì)
- 一種數(shù)據(jù)流類型識別模型更新方法及相關(guān)設(shè)備





