[發(fā)明專利]一種分布式服務監(jiān)控系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201410779287.2 | 申請日: | 2014-12-16 |
| 公開(公告)號: | CN104539479A | 公開(公告)日: | 2015-04-22 |
| 發(fā)明(設(shè)計)人: | 裴寶慶;劉波;鄧偉 | 申請(專利權(quán))人: | 北京中交興路車聯(lián)網(wǎng)科技有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/24 |
| 代理公司: | 北京和信華成知識產(chǎn)權(quán)代理事務所(普通合伙) 11390 | 代理人: | 胡劍輝 |
| 地址: | 101111 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 分布式 服務 監(jiān)控 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)服務監(jiān)控的技術(shù)領(lǐng)域,具體地涉及一種分布式服務監(jiān)控系統(tǒng)及方法。
背景技術(shù)
在高可用網(wǎng)絡(luò)服務系統(tǒng)中,對服務進行監(jiān)控并及時執(zhí)行故障轉(zhuǎn)移是保證服務高可用性的重要手段。現(xiàn)有的監(jiān)控系統(tǒng)主要有兩種:
1.本地監(jiān)控
在被監(jiān)控服務所在服務器上設(shè)置監(jiān)控系統(tǒng),監(jiān)控服務進程是否存活。
2.遠程監(jiān)控
在遠程服務器上設(shè)置監(jiān)控系統(tǒng),通過ping或心跳等手段判斷被監(jiān)控服務是否存活。
以上兩種方案均屬于單點監(jiān)控,并且其故障恢復措施簡單。前者通過重啟服務以期故障自動修復;后者通過修改IP或域名指向來屏蔽有故障服務并指向新服務,從而完成故障轉(zhuǎn)移。
現(xiàn)有兩種方案的缺陷有:
1.狀態(tài)檢測不準確
單點監(jiān)控無法完整反映被監(jiān)控服務的真實狀態(tài),從而造成檢測到的服務狀態(tài)不準確甚至誤報的問題。
第一種監(jiān)控系統(tǒng)無法獲取外部網(wǎng)絡(luò)狀態(tài),比如外部應用與被監(jiān)控服務之間網(wǎng)絡(luò)不可達。這樣就無法及時的發(fā)現(xiàn)故障并進行故障轉(zhuǎn)移。
第二種監(jiān)控系統(tǒng)無法全面反映不同網(wǎng)絡(luò)運營商、不同地區(qū)對被監(jiān)控服務的影響。
以上兩種系統(tǒng)都無法正確處理監(jiān)控程序自身故障時的情景。
2.故障轉(zhuǎn)移措施簡單粗暴
很多故障通過重啟服務并不能得到修復,所以這些情況下第一種監(jiān)控系統(tǒng)無法正常地進行故障轉(zhuǎn)移或恢復。
第二種監(jiān)控系統(tǒng)在進行故障轉(zhuǎn)移時并不能選擇真正最優(yōu)的備份服務。比如,監(jiān)控系統(tǒng)總是選擇與它處在相同機房的備份服務進行轉(zhuǎn)移。因為同機房的網(wǎng)絡(luò)狀況大部分情況下好于跨機房的網(wǎng)絡(luò)狀況。從而,給監(jiān)控系統(tǒng)造成該備份服務要優(yōu)于其他備份服務的假象。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題是:克服現(xiàn)有技術(shù)的不足,提供一種分布式服務監(jiān)控系統(tǒng),其能夠全面完整地監(jiān)控服務狀態(tài),從而把漏報、誤報降到最低,不再受單個監(jiān)控單元自身故障的干擾,通過提高監(jiān)控系統(tǒng)自身的高可用性來提高整個服務的高可用性。
本發(fā)明的技術(shù)解決方案是:這種分布式服務監(jiān)控系統(tǒng),該系統(tǒng)包括m個監(jiān)控單元,m為大于1的整數(shù),這些監(jiān)控單元部署在m個點,覆蓋不同地區(qū)、不同網(wǎng)絡(luò)運營商、不同機房;監(jiān)控單元組成分布式結(jié)構(gòu),各個監(jiān)控單元彼此聯(lián)系;如果n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務出現(xiàn)故障,1≤n≤m,則進行故障轉(zhuǎn)移;服務恢復后,如果n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務已經(jīng)恢復,1≤n≤m,則進行故障恢復。
由于監(jiān)控單元部署在m個點,覆蓋不同地區(qū)、不同網(wǎng)絡(luò)運營商、不同機房,監(jiān)控單元組成分布式結(jié)構(gòu),各個監(jiān)控單元彼此聯(lián)系,所以這種分布式服務監(jiān)控系統(tǒng)能夠全面完整地監(jiān)控服務狀態(tài),從而把漏報、誤報降到最低,不再受單個監(jiān)控單元自身故障的干擾,通過提高監(jiān)控系統(tǒng)自身的高可用性來提高整個服務的高可用性。
還提供了采用該系統(tǒng)的方法,該方法包括以下步驟:
(1)將m個監(jiān)控單元部署在m個點,m為大于2的整數(shù),覆蓋不同地區(qū)、不同網(wǎng)絡(luò)運營商、不同機房;
(2)監(jiān)控單元組成分布式結(jié)構(gòu),各個監(jiān)控單元彼此聯(lián)系;
(3)判斷是否有n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務出現(xiàn)故障,1≤n≤m,是則執(zhí)行步驟(4),否則重新判斷是否有n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務出現(xiàn)故障;
(4)從這m個監(jiān)控單元中選舉一個作為主監(jiān)控單元來執(zhí)行故障轉(zhuǎn)移;
(5)從各監(jiān)控單元推舉的最優(yōu)備份服務中,選舉最終的備份服務以備故障轉(zhuǎn)移,備份服務選定以后,主監(jiān)控單元執(zhí)行故障轉(zhuǎn)移;
(6)判斷是否有n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務已經(jīng)恢復,1≤n≤m,是則執(zhí)行步驟(7),否則重新判斷是否有n個或n個以上監(jiān)控單元檢測到被監(jiān)控服務已經(jīng)恢復;
(7)當被監(jiān)控服務進入恢復后,從各監(jiān)控單元中選舉一個作為主監(jiān)控單元執(zhí)行故障恢復。
附圖說明
圖1為采用本發(fā)明的分布式服務監(jiān)控系統(tǒng)的方法的流程圖。
圖2為根據(jù)本發(fā)明的監(jiān)控單元的示意圖。
圖3為根據(jù)本發(fā)明的故障轉(zhuǎn)移的示意圖。
圖4為根據(jù)本發(fā)明的故障恢復的示意圖。
具體實施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京中交興路車聯(lián)網(wǎng)科技有限公司;,未經(jīng)北京中交興路車聯(lián)網(wǎng)科技有限公司;許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410779287.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 一種范圍廣、力度大的校內(nèi)監(jiān)控系統(tǒng)
- 一種監(jiān)控的方法及系統(tǒng)
- 設(shè)備的監(jiān)控方法、裝置、系統(tǒng)和空調(diào)
- 多級校內(nèi)監(jiān)控系統(tǒng)
- 設(shè)備監(jiān)控方法、裝置、計算機設(shè)備及存儲介質(zhì)
- 風險雷達預警的監(jiān)控方法及系統(tǒng)
- 區(qū)塊鏈網(wǎng)絡(luò)監(jiān)控系統(tǒng)、裝置及方法
- 基于機器視覺的車站客流安全智能監(jiān)控系統(tǒng)





