[發明專利]數據湖的性能診斷方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110738024.7 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113342502B | 公開(公告)日: | 2023-01-20 |
| 發明(設計)人: | 鄧晟;黃亞兵;陳陽;林開賢;敖毅波;沈志勇 | 申請(專利權)人: | 招商局金融科技有限公司 |
| 主分類號: | G06F9/48 | 分類號: | G06F9/48;G06F9/50 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 黃章輝 |
| 地址: | 518000 廣東省深圳市福田區華富街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 性能 診斷 方法 裝置 計算機 設備 存儲 介質 | ||
本發明公開了一種數據湖的性能診斷方法、裝置、計算機設備及存儲介質,所述方法包括:從上一預設周期的任務調度信息數據中,獲取滿足服務等級協議的日期的任務調度信息數據;根據第一起始執行時間和第一終止執行時間,確定在執行日期內每個預設時間段的延遲系數;根據拉依達準則和延遲系數,計算得到第一異常值檢測閾值和第二異常值檢測閾值;獲取當前執行日期的任務調度信息數據;根據第二起始執行時間、第二終止執行時間和當前執行日期,計算得到當前延遲系數;根據當前延遲系數、第一異常值檢測閾值和第二異常值檢測閾值,將數據湖的當前性能和歷史性能進行比較,確定數據湖的當前性能是否滿足等級服務協議,提高確定數據湖的性能的效率。
技術領域
本發明涉及數據分析技術領域,尤其涉及一種數據湖的性能診斷方法、裝置、計算機設備及存儲介質。
背景技術
企業數據湖為企業提供大數據批量計算服務,通過調度系統對批量計算任務進行周期性調度,易出現周期性調度任務延遲的情況,例如,當調度系統將批量計算任務提交到數據湖執行時,提交的批量計算任務超過了調度系統并發,會導致任務執行時間增加,且數據湖基礎服務(如Hive、Yarn、GaussDB200)的性能下降,如系統進程內存溢出、頻繁FullGC、負載不均衡、數據傾斜、業務表數據膨脹等,也會導致任務執行時間增加;當批量計算任務使用數據湖的CPU、內存、IO等計算資源時,在計算資源出現瓶頸時,如新上線任務資源使用量大,導致在計算資源緊張,計算任務排隊延遲執行,導致任務執行時間增加。
目前,主要需要技術人員逐個排查周期性調度任務延遲的原因,效率低下,無法快速確定數據湖的性能。
發明內容
本發明實施例提供一種數據湖的性能診斷方法、裝置、計算機設備和存儲介質,以提高確定數據湖的性能的效率。
為了解決上述技術問題,本申請實施例提供一種數據湖的性能診斷方法,包括:
從上一預設周期的任務調度信息數據中,獲取滿足服務等級協議的日期的任務調度信息數據,作為第一基準數據集,其中,所述預設周期為M天,每天由N個連續的預設時間段組成,所述第一基準數據集包括K個第一任務編號、每個所述第一任務編號對應的第一起始執行時間、每個所述第一任務編號對應的第一終止執行時間和每個所述第一任務編號對應的執行日期;
針對每個所述執行日期,根據所述第一起始執行時間和所述第一終止執行時間,確定在每個所述執行日期內每個所述預設時間段的延遲系數;
根據拉依達準則和所述延遲系數,計算得到每個所述預設時間段的第一異常值檢測閾值和每個所述預設時間段的第二異常值檢測閾值,其中,所述第一異常值檢測閾值小于所述第二異常值檢測閾值;
獲取當前預設周期中當前執行日期的任務調度信息數據,作為第二基準數據集,所述第二基準數據集包括L個第二任務編號、每個第二任務編號對應的第二起始執行時間、每個第二任務編號對應的第二終止執行時間和每個第二任務編號對應的所述當前執行日期;
根據所述第二起始執行時間、所述第二終止執行時間和所述當前執行日期,計算得到在所述當前執行日期的當前預設時間段的當前延遲系數;
根據所述當前延遲系數、所述第一異常值檢測閾值和所述第二異常值檢測閾值,將所述當前預設時間段內數據湖的當前性能和所述預設時間段內數據湖的歷史性能進行比較,確定所述當前預設時間段內數據湖的當前性能是否滿足所述等級服務協議。
為了解決上述技術問題,本申請實施例還提供一種數據湖的性能診斷裝置,包括:
第一獲取模塊,用于從上一預設周期的任務調度信息數據中,獲取滿足服務等級協議的日期的任務調度信息數據,作為第一基準數據集,其中,所述預設周期為M天,每天由N個連續的預設時間段組成,所述第一基準數據集包括K個第一任務編號、每個所述第一任務編號對應的第一起始執行時間、每個所述第一任務編號對應的第一終止執行時間和每個所述第一任務編號對應的執行日期;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于招商局金融科技有限公司,未經招商局金融科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110738024.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:隔音墻式水下便于組裝裝置
- 下一篇:碟剎制動式切割機構
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





