[發明專利]一種垃圾數據清理方法、裝置、電子設備及可讀存儲介質有效
| 申請號: | 201811213300.2 | 申請日: | 2018-10-18 |
| 公開(公告)號: | CN111078389B | 公開(公告)日: | 2023-09-05 |
| 發明(設計)人: | 徐福生;鄧長春 | 申請(專利權)人: | 杭州海康威視數字技術股份有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50;G06F11/30;G06F9/455 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 李欣;馬敬 |
| 地址: | 310051 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 垃圾 數據 清理 方法 裝置 電子設備 可讀 存儲 介質 | ||
本發明實施例提供了一種垃圾數據清理方法。該方法應用于分布計算框架中的Driver端,包括:根據監測得到的數量計算消息隊列的壓力值;判斷壓力值是否大于預設壓力閾值;當判斷出壓力值大于預設壓力閾值時,向分布式計算框架中的Worker端發送高壓狀態通知,以使得Worker端在監測到第一性能指標的指標值達到第一預設閾值時,觸發Worker端的虛擬機中的GC程序,在監測到第二性能指標的指標值滿足第一清理條件時,向Driver端發送觸發指令;當接收到Worker端發送的觸發指令時,觸發Driver端中的垃圾清理器對Worker端中的垃圾數據進行清理。與現有技術相比,應用本發明實施例提供的方案,當Driver端的任務接收速率超過Worker端的任務處理速率時,可以及時對垃圾數據進行清理,避免Worker端內存泄露。
技術領域
本發明涉及大數據技術領域,特別是涉及一種垃圾數據清理方法、裝置、電子設備及可讀存儲介質。
背景技術
當前,Spark分布式計算框架因為其具有的效率更高、運行速度更快等特點,在實際應用中對海量信息進行數據處理時發揮著重要作用。
Spark分布式計算框架中可以包括Master端、Worker端和Driver端。其中,Master端用于對Worker端當前任務處理情況和內存使用情況進行監測。Driver端用于接收待處理任務,并得到由所接收的待處理任務構成的消息隊列;根據Master端的監測結果向Worker端分配待處理任務。而Worker端對待處理任務進行處理,并根據待處理任務的類型對任務處理過程中產生的垃圾數據進行注冊,注冊信息表征了這些垃圾數據由哪些對象進行清理。其中,能夠進行垃圾清理的對象包括:運行在Worker端的虛擬機中的GC(GarbageCollection,垃圾回收)程序、運行在Driver端的虛擬機中的GC程序以及Driver端中的垃圾清理器(ContextCleaner)。
當前,Spark分布式計算框架中的垃圾數據處理流程為:當Worker端監測到自身虛擬機的內存的占用率,達到預設閾值時,Worker端便會觸發該虛擬機的GC程序以進行垃圾數據清理,進而,該GC程序會觸發垃圾清理器進行垃圾數據清理。
發明人在實現本發明的過程中發現:當Driver端的任務接收速率超過Worker端的任務處理速率時,Driver端會向Worker端分配大量的待處理任務,此時,在Worker端處理任務而產生垃圾數據的同時,由Driver端與Worker端的交互所產生的垃圾數據也在持續增加,顯然,Worker端中會積累大量的待處理任務和垃圾數據。
在這種情況下,當上述GC程序觸發垃圾清理器進行垃圾清理時,垃圾清理器可能無法及時清理出足夠的內存空間以存儲新的待處理任務和垃圾數據,從而導致Worker端發生內存泄露,影響Spark分布式計算框架的穩定性和任務處理效率。
發明內容
本發明實施例的目的在于提供一種垃圾數據清理方法、裝置、電子設備及可讀存儲介質,以實現當Driver端的任務接收速率超過Worker端的任務處理速率時,可以及時對垃圾數據進行清理,避免Worker端內存泄露,提高Spark的穩定性和任務處理效率。
具體技術方案如下:
第一方面,本發明實施例提供了一種垃圾數據清理方法,應用于分布式計算框架中的Driver端;所述方法包括:
監測消息隊列所包括待處理任務的數量,并根據監測得到的數量計算所述消息隊列的壓力值;
判斷所述壓力值是否大于預設壓力閾值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州海康威視數字技術股份有限公司,未經杭州海康威視數字技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811213300.2/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





