[發(fā)明專利]一種主機(jī)運(yùn)行指標(biāo)監(jiān)控告警方法及系統(tǒng)裝置在審
| 申請?zhí)枺?/td> | 201810253504.2 | 申請日: | 2018-03-26 |
| 公開(公告)號: | CN108509314A | 公開(公告)日: | 2018-09-07 |
| 發(fā)明(設(shè)計(jì))人: | 黃東;厲超 | 申請(專利權(quán))人: | 武漢楚鼎信息技術(shù)有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F11/32 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430000 湖北省武漢市東湖新技術(shù)開*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 指標(biāo)監(jiān)控 告警 監(jiān)控主機(jī) 歷史數(shù)據(jù) 系統(tǒng)裝置 主機(jī)運(yùn)行 歷史記錄數(shù)據(jù) 發(fā)現(xiàn)系統(tǒng) 告警通知 實(shí)時采集 同一時刻 異常告警 求平均 求和 記錄 靈敏 天數(shù) 采集 | ||
本發(fā)明公開了一種主機(jī)運(yùn)行指標(biāo)監(jiān)控告警方法及系統(tǒng)裝置,其主要技術(shù)方案是獲取被監(jiān)控主機(jī)的CPU使用率指標(biāo)的最近若干天的歷史記錄數(shù)據(jù),這些歷史數(shù)據(jù)按分鐘記錄,每分鐘需要有一個CPU使用率的平均值。將上述歷史數(shù)據(jù)不同天在一天內(nèi)的同一分鐘的值求和,然后除以天數(shù),求平均。既得一天內(nèi)該分鐘的閾值或閾值范圍。一天有24*60=1440分鐘,因此閾值有1440個不同值。實(shí)時采集被監(jiān)控主機(jī)的CPU使用率指標(biāo),并記錄當(dāng)前時間,與求得的同一時刻的閾值或閾值范圍進(jìn)行對比,若采集值大于該閾值或閾值范圍,則發(fā)出告警通知。從而實(shí)現(xiàn)更細(xì)致更靈敏的指標(biāo)監(jiān)控及異常告警,使系統(tǒng)管理員能更早的發(fā)現(xiàn)系統(tǒng)的異常,及時作出相應(yīng)的對策。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)服務(wù)器操作系統(tǒng)運(yùn)行指標(biāo)健康狀況監(jiān)控,及異常告警通知的一種改進(jìn)方案。尤其對于需要監(jiān)控?cái)?shù)量巨大的計(jì)算機(jī)服務(wù)器主機(jī)運(yùn)行指標(biāo)監(jiān)控告警的改進(jìn)方法及系統(tǒng)裝置。
背景技術(shù)
在計(jì)算機(jī)服務(wù)器運(yùn)維工作中,實(shí)時監(jiān)控每臺服務(wù)器系統(tǒng)運(yùn)行指標(biāo)是必要工作。這些指標(biāo)包括計(jì)算機(jī)的CPU使用率,內(nèi)存使用率,硬盤使用率,系統(tǒng)負(fù)載率,網(wǎng)絡(luò)帶寬使用量等等。這些指標(biāo)反映計(jì)算機(jī)的健康狀況,當(dāng)指標(biāo)不在正常范圍時,計(jì)算機(jī)系統(tǒng)可能無法正常工作。下面以其中一個指標(biāo)(CPU使用率)為例,說明現(xiàn)有監(jiān)控告警機(jī)制存在的問題。CPU使用率是衡量計(jì)算機(jī)CPU工作量大小的指標(biāo),指標(biāo)取值范圍是0%~100%。當(dāng)指標(biāo)為0%時代表計(jì)算機(jī)完全空閑,可以及時響應(yīng)新任務(wù)。當(dāng)指標(biāo)為100%時,說明計(jì)算機(jī)任務(wù)很繁忙,新任務(wù)可能不能及時響應(yīng)。CPU使用率大小跟計(jì)算機(jī)任務(wù)量多少成正比。當(dāng)CPU使用率過高時,需要通知系統(tǒng)管理員檢查是否存在異常情況并做進(jìn)一步處理。目前現(xiàn)有的做法是,設(shè)定一個固定閾值,例如80%,當(dāng)CPU使用率超過80%時,則觸發(fā)告警機(jī)制,通知系統(tǒng)管理員。目前的這個機(jī)制可以粗略的解決指標(biāo)過高的報(bào)警,但是其方法過于簡單、粗放,不夠靈活和細(xì)致。
對于一部分服務(wù)器,其上運(yùn)行的業(yè)務(wù)是具有周期性的,例如證券的行情服務(wù)器,交易日開盤時間:9:30-11:30,13:00-15:00。那么在開盤期間業(yè)務(wù)量會顯著增大,這將導(dǎo)致服務(wù)器的CPU使用率也會明顯變大,收盤后業(yè)務(wù)量減小,又會使CPU使用率變小。基于這種周期性可以認(rèn)為,開盤期間內(nèi)CPU使用率明顯低于歷史同期,或者在收盤期間內(nèi)CPU使用率明顯高于歷史同期,則可以認(rèn)為該機(jī)器可能存在異常,需要及時通知管理員排查。而利用傳統(tǒng)的方法設(shè)置固定閾值(如80%)告警的方案則沒辦法發(fā)覺該類異常行為。
發(fā)明內(nèi)容
本發(fā)明的目的是根據(jù)現(xiàn)有方案的不足之處,提出一種基于指標(biāo)歷史監(jiān)控?cái)?shù)據(jù)的周期性來動態(tài)設(shè)定閾值。在一天內(nèi)的不同時刻,其指標(biāo)的閾值不同。這個閾值根據(jù)近期的歷史數(shù)據(jù)進(jìn)行計(jì)算,并每天更新,從而實(shí)現(xiàn)更細(xì)致更靈敏的指標(biāo)監(jiān)控及異常告警,使系統(tǒng)管理員能更早的發(fā)現(xiàn)系統(tǒng)的異常。
為解決上述問題,本發(fā)明提供的改進(jìn)方案包括以下步驟:
第一方面,一種主機(jī)運(yùn)行指標(biāo)監(jiān)控告警方法,所述方法包括:
監(jiān)控模塊獲取存儲于數(shù)據(jù)庫中的CPU使用率指標(biāo)值歷史記錄數(shù)據(jù)集合,所述歷史記錄數(shù)據(jù)集合包含多個歷史記錄數(shù)據(jù)項(xiàng),每個歷史記錄數(shù)據(jù)項(xiàng)按時間級m進(jìn)行記錄,每個時間級m記錄一個CPU使用率指標(biāo)值;
監(jiān)控模塊獲取上述歷史記錄數(shù)據(jù)的項(xiàng)數(shù)及每個歷史記錄數(shù)據(jù)項(xiàng)的每個時間級m記錄的CPU使用率指標(biāo)值,根據(jù)公式:
計(jì)算出單個記錄數(shù)據(jù)項(xiàng)內(nèi)每個時間級m的閾值,表示每個歷史記錄數(shù)據(jù)項(xiàng)的相同時間級的CPU使用率指標(biāo)值的和,D表示所述歷史記錄數(shù)據(jù)集合包含的歷史記錄數(shù)據(jù)項(xiàng)的項(xiàng)數(shù)。
實(shí)時采集模塊采集實(shí)時CPU使用率指標(biāo)值T,記錄實(shí)時采集時間。
監(jiān)控模塊獲取所述實(shí)時CPU使用率指標(biāo)值T及實(shí)時采集時間,所述監(jiān)控模塊對比同一時間級的實(shí)時CPU使用率指標(biāo)值T與閾值的大小;若T>,監(jiān)控模塊發(fā)送告警通知;若T≤,監(jiān)控模塊等待下一個時間級啟動對比。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢楚鼎信息技術(shù)有限公司,未經(jīng)武漢楚鼎信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810253504.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 一種告警信息的生成方法及裝置
- 一種IT基礎(chǔ)平臺監(jiān)控指標(biāo)采集系統(tǒng)及采集方法
- 一種監(jiān)控方法、裝置和系統(tǒng)
- 資源指標(biāo)的監(jiān)控方法及裝置
- 監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法、域值調(diào)整方法及自動監(jiān)控系統(tǒng)
- 網(wǎng)絡(luò)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 一種自定義的可視化實(shí)時監(jiān)控?cái)?shù)據(jù)監(jiān)控方法
- 一種指標(biāo)異常原因的識別方法及裝置
- 自定義監(jiān)控指標(biāo)的監(jiān)控視圖繪制方法、裝置及計(jì)算機(jī)設(shè)備
- 指標(biāo)監(jiān)控方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種推薦系統(tǒng)及推薦方法
- 一種通訊終端快捷訪問歷史數(shù)據(jù)的裝置及方法
- 歷史數(shù)據(jù)歸檔方法及歷史數(shù)據(jù)歸檔裝置
- 一種實(shí)時數(shù)據(jù)庫的存儲方法
- 一種數(shù)據(jù)拆分存儲方法及裝置
- 一種機(jī)電設(shè)備物聯(lián)網(wǎng)系統(tǒng)中減少服務(wù)器壓力的方法
- 一種歷史數(shù)據(jù)輸出處理方法及裝置
- 歷史數(shù)據(jù)的清理方法及其系統(tǒng)、存儲介質(zhì)、電子設(shè)備
- 一種實(shí)現(xiàn)業(yè)務(wù)通用歷史數(shù)據(jù)管理的系統(tǒng)及其方法
- 基于統(tǒng)一支撐平臺的電網(wǎng)歷史數(shù)據(jù)管理方法及系統(tǒng)





