[發明專利]一種高可用的云監控系統及監控方法在審
| 申請號: | 201710153557.2 | 申請日: | 2017-03-15 |
| 公開(公告)號: | CN106878111A | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 張建偉;高傳集;孫思清 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26 |
| 代理公司: | 濟南舜源專利事務所有限公司37205 | 代理人: | 劉曉政 |
| 地址: | 450000 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 可用 監控 系統 方法 | ||
技術領域
本發明屬于云計算技術領域;具體涉及一種高可用的云監控系統及監控方法。
背景技術
云資源監控系統是保證云平臺正常運轉的關鍵,旨在收集資源負載信息,是作業調度、負載均衡、事件預測、故障檢測及恢復等的前提。
對云平臺上動態、復雜的虛擬資源進行實時、有效的監控和管理是保證云平臺可用性的關鍵。
現有云監控系統中,為實時反映云平臺中的資源負載情況,監控組件需要大量收集資源負載信息,監控組件與被監控資源間存在頻繁的數據傳輸,造成較大的通信開銷,容易導致網絡擁堵,很難做到監控信息的實時同步和監控系統的穩定可靠,并對云平臺的運轉造成干擾,影響云平臺的正常使用,降低服務質量。此為現有技術的不足之處。
因此,針對現有技術中的上述缺陷,提供設計一種高可用的云監控系統及監控方法;以解決上述技術問題,是非常有必要的。
發明內容
本發明的目的在于,針對上述現有技術存在的缺陷,提供設計一種高可用的云監控系統及監控方法,以解決上述技術問題。
為實現上述目的,本發明給出以下技術方案:
一種高可用的云監控系統,它包括設置于各個待檢測節點的agent模塊;其特征在于,各agent模塊將采集到的待檢測節點的狀態信息發送到agentCluster節點,agentCluster節點將采集到的數據發送至SERVER服務端;
所述的待檢測節點包括物理主機和虛擬機。
優選地,各agent模塊之間定期相互發送心跳信息。
本發明還給出一種高可用的云監控方法,包括以下步驟:
步驟1):在待監控主機中設置智能agent模塊,并通過Server服務端以文件的形式將監控任務發送到待監控主機中;待監控主機包括物理主機以及虛擬機;
步驟2):將監控腳本(BAT或是SHELL形式)通過Server服務端傳送到待監控物理主機以及虛擬機中;腳本傳輸完結束后向agent模塊傳送監控命令,agent模塊收到命令后運行對應的腳本文件,采集監控數據;
步驟3):以物理主機中的agent模塊作為agentCluster節點,虛擬機中的agent作為Cluster群集合的成員;Cluster群集合成員中的各agent模塊之間以固定時間Theartbeating發送心跳數據報文,作為各agent模塊存活的標志;
步驟4):各agent模塊依據任務列表讀取任務腳本,發送采集到的數據給agentCluster節點;初始監控周期為default_monitor_time(i),同時設置監控周期變化步長,采樣的時間間隔的調整大小為原子時間atomic_time(i)的整數倍;
步驟5):agent分別為不同的監控指標建立對應的存儲隊列,并計算數據緩沖隊列中的數據的偏差情況,其計算使用如下模型:
其中δ表示樣本數據的標準差,Xi為采集到的第i個數據的狀態信息;
步驟6):在步驟5)的基礎上,定義第i個監控指標的數據偏差的上限為threshold(i);如果采集到的數據的變化趨勢較為平穩即δ<threshold(i),則增大數據監控采樣周期,如果監控采集到的數據的變化趨勢較大,即δ>=threshold(i),則縮小數據監控采樣周期的大小;
步驟7):agentCluster節點接收到數據之后,將監控數據通過消息隊列發送給監控平臺的Server服務端。
作為優選,所述步驟1)中,監控任務包括監控指標(cpu,內存,存儲等)以及監控腳本的存放路徑。
作為優選,所述步驟3)中還包括以下步驟:
當agent超過時間Theartbeating,沒有發送心跳數據,則認為該agent已關閉;agentCluster節點負責定時報告成員agent的運行狀態;當cluster群集合成員發現agentCluster關閉,則啟動分布式選舉算法Paxos,重新選擇agentCluster節點。
作為優選,所述步驟6)中,增大數據監控采樣周期的計算模型為:
monitor_time(i)=default_monitor_time(i)①
monitor_time(i)=monitor_time(i)+atomic_time(i)*f(δ,threshold(i))②
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710153557.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據流量的監控方法、裝置及設備
- 下一篇:一種網關控制器、數據傳輸方法及裝置





