[發(fā)明專利]一種用于檢測應(yīng)用集群健康度的系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202011609759.1 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112749071A | 公開(公告)日: | 2021-05-04 |
| 發(fā)明(設(shè)計)人: | 陳勝仇;吳海洋;吳倩;花卉;王瑋;馬德晶;周士成 | 申請(專利權(quán))人: | 中國人壽保險股份有限公司上海數(shù)據(jù)中心 |
| 主分類號: | G06F11/34 | 分類號: | G06F11/34 |
| 代理公司: | 上海科盛知識產(chǎn)權(quán)代理有限公司 31225 | 代理人: | 丁云 |
| 地址: | 200131 上海市浦東新區(qū)中國(上*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 檢測 應(yīng)用 集群 健康 系統(tǒng) 方法 | ||
1.一種用于檢測應(yīng)用集群健康度的系統(tǒng),其特征在于,包括數(shù)據(jù)采集單元、動態(tài)基線計算單元、異常檢測單元、告警單元、任務(wù)調(diào)度單元和本地數(shù)據(jù)庫,
所述的數(shù)據(jù)采集單元用于采集APM工具生成的性能數(shù)據(jù),并存儲至本地數(shù)據(jù)庫,
所述的動態(tài)基線計算單元用于根據(jù)本地數(shù)據(jù)庫中的歷史時序性能數(shù)據(jù),生成動態(tài)基線,
所述的異常檢測單元用于本地數(shù)據(jù)庫中的實時性能數(shù)據(jù)進行異常檢測,并對實時數(shù)據(jù)打上正常標(biāo)簽或異常標(biāo)簽,
所述的告警單元用于根據(jù)異常檢測單元的異常檢測結(jié)果判斷應(yīng)用集群的健康度,并發(fā)出告警信息,
所述的本地數(shù)據(jù)庫用于儲存性能數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的一種用于檢測應(yīng)用集群健康度的系統(tǒng),其特征在于,所述的系統(tǒng)還包括前端展示單元,所述的前端展示單元用于實時展示各應(yīng)用集群指標(biāo)的動態(tài)基線和健康度。
3.一種用于檢測應(yīng)用集群健康度的方法,其特征在于,基于權(quán)利要求1所述的一種用于檢測應(yīng)用集群健康度的系統(tǒng),包括以下步驟:
S1:初始化待監(jiān)控的應(yīng)用集群信息;
S2:數(shù)據(jù)采集單元采集APM工具生成的性能數(shù)據(jù),并存儲至本地數(shù)據(jù)庫;
S3:基線計算單元根據(jù)本地數(shù)據(jù)庫中的歷史時序性能數(shù)據(jù),獲取動態(tài)基線;
S4:異常檢測單元對本地數(shù)據(jù)庫中的實時性能數(shù)據(jù)進行異常檢測;
S5:告警單元根據(jù)異常檢測單元的異常檢測結(jié)果判斷應(yīng)用集群的健康度,并發(fā)出告警信息。
4.根據(jù)權(quán)利要求3所述的一種用于檢測應(yīng)用集群健康度的方法,其特征在于,所述的步驟S1具體包括:
S101:同步已接入APM工具的應(yīng)用集群信息;
S102:判斷是否建立動態(tài)基線,若是進入步驟S2,否則返回步驟S101。
5.根據(jù)權(quán)利要求3所述的一種用于檢測應(yīng)用集群健康度的方法,其特征在于,所述的步驟S2具體包括:
S201:獲取APM數(shù)據(jù)源;
S201:對APM數(shù)據(jù)源進行切片統(tǒng)計,獲取數(shù)據(jù)切片;
S202:根據(jù)數(shù)據(jù)切片獲取組織關(guān)鍵性能指標(biāo)數(shù)據(jù);
S203:將組織關(guān)鍵性能指標(biāo)數(shù)據(jù)存儲至本地關(guān)系數(shù)據(jù)庫。
6.根據(jù)權(quán)利要求3所述的一種用于檢測應(yīng)用集群健康度的方法,其特征在于,所述的步驟S3具體包括:
S301:使用python pandas模塊從本地數(shù)據(jù)庫讀取歷史時序性能數(shù)據(jù);
S302:將歷史時序性能數(shù)據(jù)格式轉(zhuǎn)為Dataframe;
S303:判讀歷史時序性能數(shù)據(jù)是否存在異常數(shù)據(jù),若是,則剔除異常數(shù)據(jù)并進入S304,否則直接進入步驟S304;
S304:計算歷史時序性能數(shù)據(jù)中每天相同時點的均值和方差,根據(jù)歷史數(shù)據(jù)中每天相同時點的均值和方差生成動態(tài)基線;
S305:將動態(tài)基線寫入數(shù)據(jù)庫。
7.根據(jù)權(quán)利要求6所述的一種用于檢測應(yīng)用集群健康度的方法,其特征在于,所述的步驟S304中在歷史時序性能數(shù)據(jù)的均值上加2倍方差生成動態(tài)基線最大值,在歷史時序性能數(shù)據(jù)的均值上減2倍方差生成動態(tài)基線最小值。
8.根據(jù)權(quán)利要求3所述的一種用于檢測應(yīng)用集群健康度的方法,其特征在于,所述的步驟S4具體包括:
S401:獲取本地數(shù)據(jù)庫中的實時性能數(shù)據(jù);
S402:判斷實時性能數(shù)據(jù)是否滿足異常規(guī)則,若是,對實時性能數(shù)據(jù)打上異常標(biāo)簽,并寫入本地數(shù)據(jù)庫,進入步驟S6,否則,進入步驟S403;
S403:根據(jù)異常檢測算法判斷性實時性能數(shù)據(jù)是否異常,若是,對實時性能數(shù)據(jù)打上異常標(biāo)簽,并寫入本地數(shù)據(jù)庫,否則對實時性能數(shù)據(jù)打上正常標(biāo)簽,寫入本地數(shù)據(jù)庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人壽保險股份有限公司上海數(shù)據(jù)中心,未經(jīng)中國人壽保險股份有限公司上海數(shù)據(jù)中心許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011609759.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠程應(yīng)用進行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)
- 一種集群調(diào)度呼叫業(yè)務(wù)中主叫終端信息顯示方法
- 更新網(wǎng)絡(luò)流量管理設(shè)備同時維持有效性
- 與集群調(diào)度系統(tǒng)進行通信的方法、群集接入網(wǎng)關(guān)及系統(tǒng)
- 一種管理集群通信系統(tǒng)資源的方法
- 基于Kubernetes和OpenStack容器云平臺多集群構(gòu)建方法、介質(zhì)、設(shè)備
- 一種容災(zāi)系統(tǒng)、容災(zāi)處理方法、監(jiān)控節(jié)點和備份集群
- 一種ETCD集群恢復(fù)方法、系統(tǒng)、設(shè)備及計算機介質(zhì)
- 混合云場景下保證可用集群數(shù)量的方法、裝置及系統(tǒng)
- 一種集群拓撲更新方法、系統(tǒng)、設(shè)備及計算機存儲介質(zhì)
- 集群切換方法、集群切換裝置、電子設(shè)備及可讀存儲介質(zhì)





