[發(fā)明專利]大規(guī)模分布式系統(tǒng)匯總與監(jiān)控的有效方法有效
| 申請?zhí)枺?/td> | 201680086979.6 | 申請日: | 2016-12-07 |
| 公開(公告)號: | CN109690495B | 公開(公告)日: | 2020-08-25 |
| 發(fā)明(設(shè)計)人: | 夏伊.霍羅威茨;亞伊·阿里安;吳文良 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F11/34 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;李稷芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 大規(guī)模 分布式 系統(tǒng) 匯總 監(jiān)控 有效 方法 | ||
本發(fā)明第一方面提供一種用于通過動態(tài)控制求解模型來監(jiān)控性能指標值的監(jiān)控服務(wù)器,包括:存儲代碼的存儲器;耦合到所述存儲器的至少一個硬件處理器,用于執(zhí)行所述代碼,所述代碼包括:用于匯總表示性能指標的測量值的數(shù)據(jù)點的指令,所述數(shù)據(jù)點根據(jù)求解模型劃分數(shù)值區(qū)間,所述數(shù)據(jù)點從多個受監(jiān)控節(jié)點接收到,多個受監(jiān)控節(jié)點從監(jiān)控服務(wù)器接收求解模型;用于通過計算所需百分位數(shù)位于哪個數(shù)值區(qū)間中來計算所需百分位數(shù)值區(qū)間的指令;用于基于所需百分位數(shù)值區(qū)間的所需求解值來確定修改的求解模型,并將修改的求解模型發(fā)送到多個受監(jiān)控節(jié)點的指令。
背景技術(shù)
本發(fā)明在其一些實施例中涉及用于監(jiān)控分布式計算系統(tǒng)性能的監(jiān)控服務(wù)器,更具體地但非排他地,通過動態(tài)地修改表示分布式計算機的測量性能的分布式模型的求解值來監(jiān)控性能。
云計算和數(shù)據(jù)中心服務(wù)是大型組織常用的存儲和計算解決方案。但是,監(jiān)控多個受監(jiān)控節(jié)點的性能指標會給運營商帶來技術(shù)挑戰(zhàn)。云計算服務(wù)中的應(yīng)用程序可以運行在數(shù)千或數(shù)萬個受監(jiān)控節(jié)點上,例如VM、容器、計算機等。為了監(jiān)控全系統(tǒng)性能,在此被稱為受監(jiān)控實體的每個相關(guān)聯(lián)的受監(jiān)控節(jié)點可以將性能數(shù)據(jù)報告給監(jiān)控服務(wù)器,該監(jiān)控服務(wù)器聚合該性能數(shù)據(jù)并計算系統(tǒng)性能。系統(tǒng)所需的性能通常在服務(wù)提供商和客戶之間的服務(wù)級別協(xié)議(service level agreement,簡稱SLA)中規(guī)定。
客戶端應(yīng)用程序通常對資源具有動態(tài)需求,可由云和/或數(shù)據(jù)中心使用高級自動調(diào)整進行分配。但是,資源調(diào)整會使實時監(jiān)控性能變得更加復(fù)雜。只有在分配給特定客戶端以便計算自動調(diào)整操作對該客戶的SLA的影響時,才需要來自受監(jiān)控實體的反饋。
例如,SLA可以指定報告所有受監(jiān)控實體的響應(yīng)時間的第99百分位。為了確定在云和/或數(shù)據(jù)中心上執(zhí)行的應(yīng)用程序的第99百分位,每個監(jiān)控實體必須將所有響應(yīng)時間傳輸?shù)奖O(jiān)控服務(wù)器,該監(jiān)控服務(wù)器聚合數(shù)據(jù)并計算第99百分位響應(yīng)時間。
計算性能指標通常可能導(dǎo)致受監(jiān)控實體傳輸一定數(shù)量的數(shù)據(jù),這些數(shù)據(jù)會使本地網(wǎng)絡(luò)過載,降低對客戶的服務(wù)質(zhì)量和/或降低云運營商網(wǎng)絡(luò)的可用性。報告數(shù)據(jù)的數(shù)量可能會導(dǎo)致監(jiān)控服務(wù)器上的處理負載,這可能會增加報告延遲。
用于收集性能數(shù)據(jù)的現(xiàn)有解決方案包括NewRelic、AppDynamics、Dynatrace和Sysdig,但是這些解決方案會生成大量的性能數(shù)據(jù),這可能會降低對客戶的服務(wù)質(zhì)量。
用于減少性能數(shù)據(jù)量的現(xiàn)有解決方案包括Q-Digest算法。但Q-Digest算法不能處理受監(jiān)控實體的動態(tài)分配,需要預(yù)先定義合適的壓縮參數(shù),并且根據(jù)所選擇的壓縮因子來限制精度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供通過動態(tài)控制求解模型來監(jiān)控性能指標值的系統(tǒng)和方法。前述和其它目的通過獨立權(quán)利要求的特征來實現(xiàn)。其它實現(xiàn)在從屬權(quán)利要求、說明書和附圖中顯而易見。
本發(fā)明第一方面提供一種用于通過動態(tài)控制求解模型來監(jiān)控性能指標值的監(jiān)控服務(wù)器,包括:存儲代碼的存儲器;耦合到所述存儲器的至少一個硬件處理器,用于執(zhí)行所述代碼,所述代碼包括:用于匯總表示性能指標的測量值的數(shù)據(jù)點的指令,所述數(shù)據(jù)點根據(jù)求解模型劃分數(shù)值區(qū)間,所述數(shù)據(jù)點從多個受監(jiān)控節(jié)點接收到,多個受監(jiān)控節(jié)點從監(jiān)控服務(wù)器接收求解模型;用于通過計算所需百分位數(shù)位于哪個數(shù)值區(qū)間中來計算所需百分位數(shù)值區(qū)間的指令;用于基于所需百分位數(shù)值區(qū)間的所需求解值來確定修改的求解模型,并將修改的求解模型發(fā)送到多個受監(jiān)控節(jié)點的指令。本發(fā)明第一方面提供了以下優(yōu)點:減少需要發(fā)送的數(shù)據(jù)量,以便監(jiān)控服務(wù)器監(jiān)控多個受監(jiān)控實體的性能指標。
本發(fā)明第二方面提供一種通過動態(tài)控制求解模型來監(jiān)控性能指標值的方法,包括:匯總從接收求解模型的多個受監(jiān)控實體接收的表示性能指標的測量值的數(shù)據(jù)點,所述數(shù)據(jù)點根據(jù)求解模型劃分數(shù)值區(qū)間;計算所需百分位數(shù)位于哪個數(shù)值區(qū)間;基于所需百分位數(shù)值區(qū)間的所需求解值來確定修改的求解模型;將修改的求解模型發(fā)送到多個受監(jiān)控節(jié)點。本發(fā)明第二方面提供了一種方法,用于減少需要發(fā)送的數(shù)據(jù)量,以便監(jiān)控服務(wù)器監(jiān)控多個受監(jiān)控實體的性能指標。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201680086979.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:系統(tǒng)存儲裝置中的分層容錯
- 下一篇:存儲器監(jiān)視器





