[發明專利]一種網關設備故障處理方法及裝置有效
| 申請號: | 201510827711.0 | 申請日: | 2015-11-24 |
| 公開(公告)號: | CN106789141B | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 曾文秋 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04L12/24 | 分類號: | H04L12/24 |
| 代理公司: | 北京合智同創知識產權代理有限公司 11545 | 代理人: | 李杰 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網關 設備 故障 處理 方法 裝置 | ||
本發明公開了一種網關設備故障處理方法。當檢測到網關設備發生故障時,獲取發生故障的網關設備當前正在執行的計算任務,根據下發計算任務時的參數篩選待分配計算任務,結束發生故障的網關設備當前正在運行的計算任務,并根據預設的調度策略將待分配計算任務調度至當前狀態為正常的其他網關設備,最后恢復待分配計算任務的任務狀態,并通過其他網關設備執行待分配計算任務。從而避免了由于網關設備發生故障而導致的計算任務失敗問題,提高了整體的計算任務執行效率以及保障了系統的穩定性。
技術領域
本申請涉及通信技術領域,特別涉及一種網關設備故障處理方法。本申請同時還涉及一種網關設備故障處理裝置。
背景技術
隨著互聯網的不斷發展,大數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。“大數據”在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。
對于目前互聯網的大中型服務提供商或是平臺運營商來說,為了能夠通過大數據研究用戶的行為,其一般都會部署專用的數據管理平臺,這些數據管理平臺一般由多個服務器組成集群共同處理數據,與服務器集群連接的同時還有網關設備(又稱為網關設備),網關設備負責將相關的數據分析計算任務提交至服務器集群。
由于客觀因素,網關設備有時會在數據分析過程中出現故障,此時需要進行Failover處理(失效轉移)處理。Failover處理是一種備份操作模式,當主要組件由于失效或預定關機時間的原因而無法工作時,這種模式中的系統組件(比如處理機、服務器、網絡或數據庫)的功能被轉嫁到二級系統組件。在針對數據進行分析的過程中,網關設備可能出現的故障情形包括以下幾種:
情形1、網關設備發生宕機
在該情況下,網關設備將進行重啟,由計算任務分發主控機進行Failover處理。
情形2、網關設備與系統斷開網絡,但是網關設備本身的進程尚存活:
在該情況下,網關設備需要保證結束已經啟動的進程,隨后由計算任務分發主控機進行Failover處理。
情形3、網關設備的進程發生崩潰
這種情況下,需要使用一種機制保證能夠結束網關設備上的進程,計算任務分發主控機進行Failover處理。
針對上述若干種故障情形,現有技術中所采取的Failover處理方案如圖1所示,包括以下步驟:
S101,網關設備發生故障(包括宕機、斷網、進程崩潰等);
S102,觸發Failover處理;
S103,結束當前網關設備上的計算任務;
S104,結束當前網關設備提交到計算集群的作業;
S105,將計算任務重新調度到另一臺網關設備;
S106,計算任務重新運行。
發明人在實現本申請的過程中發現,現有技術在當網關設備機器出現宕機、斷網、進程崩潰等故障時,計算任務Failover處理的代價非常大,需要重頭開始運行整個計算任務,既浪費計算資源,又延遲了計算任務本身的運行時間,從而導致效率十分低下。
發明內容
本發明提供了一種網關設備故障處理方法,用以在網關設備發生故障時保證已運行計算任務的正常運行,從而節省計算資源以及提高計算任務處理效率。該方法包括以下步驟:
當檢測到網關設備發生故障時,獲取發生故障的網關設備當前正在執行的計算任務;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510827711.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有散熱石墨片的筆記本電腦底座
- 下一篇:一種散熱效率高的弧形散熱機箱





