[發明專利]基于Linux操作系統的云平臺及其運行監控方法和裝置有效
| 申請號: | 201410635137.4 | 申請日: | 2014-11-12 |
| 公開(公告)號: | CN104391777B | 公開(公告)日: | 2018-01-23 |
| 發明(設計)人: | 侯健;劉彬;羅飛;宋瀟豫;張永軍;趙峰;喬詠 | 申請(專利權)人: | 中標軟件有限公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F11/34;H04L29/08 |
| 代理公司: | 北京智匯東方知識產權代理事務所(普通合伙)11391 | 代理人: | 康正德,范曉斌 |
| 地址: | 200030 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 linux 操作系統 平臺 及其 運行 監控 方法 裝置 | ||
技術領域
本發明涉及計算機領域,特別涉及一種基于Linux操作系統的云平臺及其運行監控方法和運行監控裝置。
背景技術
云計算(Cloud Computing),是一種基于互聯網的計算方式,通過這種方式,共享的軟硬件資源和信息可以按需提供給計算機和其他設備。各種云平臺(Cloud Platforms)是云計算領域中應用程序運行的基礎架構,顧名思義,這種平臺允許開發者們或是將寫好的程序放在“云”里運行,或是使用“云”里提供的服務。
目前,眾多的信息科技企業紛紛進入云計算領域,紛紛推出了各自的云平臺,然而,這些云平臺的問題也緊接著不斷暴露出來。例如2007至2008年間,亞馬遜云平臺大范圍故障;2009年,微軟云平臺崩潰,造成了嚴重后果。因此,如何保護云平臺的穩定性已經成為當前云平臺中的重要話題。
在傳統的云環境中,云平臺服務運行于服務器上,一旦出現服務崩潰,云平臺將無法正常運行。雖然可以通過高可用機制對云平臺進行保護,但這些保護機制安裝配置繁瑣且維護成本較高,而且出現一旦出現故障,定位故障原因困難。圖1是現有技術中云平臺服務的保護機制的示意圖,如圖1所示,云平臺正常運行時,一旦出現進程崩潰,高可用機制會自動啟用備機,然后再去修復故障,在故障處理完畢后,恢復云平臺運行,這種保護機制,雖然可以保護云平臺的運行穩定,但是需要建立備機,成本較高,運行維護時間長,如果備機性能不佳,還會造成正常使用。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的基于Linux操作系統的云平臺以及基于Linux操作系統的云平臺的運行監控方法和裝置。
本發明一個目的是要提供一種提高基于Linux操作系統的云平臺運行可靠性的方法。
本發明的進一個目的是要減少使用備機的成本,自動修復崩潰的服務。
根據本發明的一個方面,提供了一種基于Linux操作系統的云平臺的運行監控方法。該基于Linux操作系統的云平臺的運行監控方法包括:獲取基于Linux操作系統的云平臺中運行的監控目標服務;啟動監控目標服務對應的upstart進程;在upstart進程獲取到監控目標服務的崩潰事件后,執行upstart進程的恢復監控目標服務的工作,以修復崩潰的監控目標服務。
可選地,啟動監控目標服務對應的upstart進程包括:執行按照監控目標服務運行特點預先編寫的upstart腳本,其中upstart腳本中定義有upstart進程的啟動條件和關閉條件,以及響應監控目標服務的崩潰事件的工作。
可選地,執行upstart進程恢復監控目標服務的工作包括:重啟監控目標服務和/或恢復監控目標服務的配置。
可選地,在執行upstart進程恢復監控目標服務的工作之后還包括:生成監控目標服務的崩潰日志。
可選地,生成監控目標服務的崩潰日志包括:獲取監控目標服務的崩潰信息,并寫入系統的運行日志,其中崩潰信息包括以下任意一項或多項:監控目標服務的崩潰時間、監控目標服務崩潰時的處理器運行狀態、監控目標服務崩潰時的內存運行狀態。
可選地,云平臺中運行有多個監控目標服務,每個監控目標服務對應有一個預設的upstart進程,其中監控目標服務包括:云存儲服務、云平臺后端服務、云平臺網頁服務。
根據本發明的另一個方面,提供了一種基于Linux操作系統的云平臺的運行監控裝置。該基于Linux操作系統的云平臺的運行監控裝置包括:目標獲取模塊,配置為獲取云平臺中運行的監控目標服務;進程啟動模塊,配置為啟動監控目標服務對應基于Linux操作系統的云平臺的upstart進程;進程恢復模塊,配置為在upstart進程獲取到監控目標服務的崩潰事件后,執行upstart進程的恢復監控目標服務的工作,以修復崩潰的監控目標服務。
可選地,進程啟動模塊還配置為:執行按照監控目標服務運行特點預先編寫的upstart腳本,其中upstart腳本中定義有upstart進程的啟動條件和關閉條件,以及響應監控目標服務的崩潰事件的工作,工作包括:重啟監控目標服務和/或恢復監控目標服務的配置。
可選地,上述基于Linux操作系統的云平臺的運行監控裝置還包括:日志生成模塊,配置為:獲取監控目標服務的崩潰信息,并寫入系統的運行日志,其中崩潰信息包括以下任意一項或多項:監控目標服務的崩潰時間、監控目標服務崩潰時的處理器運行狀態、監控目標服務崩潰時的內存運行狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中標軟件有限公司,未經中標軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410635137.4/2.html,轉載請聲明來源鉆瓜專利網。





