[發(fā)明專利]一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202011465354.5 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112579391A | 公開(公告)日: | 2021-03-30 |
| 發(fā)明(設計)人: | 李博文;余杭卿;齊震宇;江磊;陳磊 | 申請(專利權(quán))人: | 浪潮云信息技術股份公司 |
| 主分類號: | G06F11/30 | 分類號: | G06F11/30;G06F16/21;G06K9/62 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250100 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 人工智能 分布式 數(shù)據(jù)庫 自動 方法 系統(tǒng) | ||
本發(fā)明公開了一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法及系統(tǒng),屬于分布式自治數(shù)據(jù)庫領域;所述的一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法,其特征是所述的方法具體步驟包括:S1對數(shù)據(jù)庫系統(tǒng)的運行信息進行采集;S2根據(jù)監(jiān)測指標數(shù)據(jù)變化確定故障信息的相關特征;S3利用故障信息的相關特征數(shù)據(jù)建立問題識別模型,對故障類型進行分類;S4設定過濾器對有效信息進行收集整理篩選,得到預警信息;S5收集預警信息并記錄對應的故障問題;本發(fā)明實現(xiàn)的自動運維方法對于所監(jiān)控的應用可盡心動態(tài)的資源分配與參數(shù)調(diào)整,本身可移植,可以很好的根據(jù)實際需求進行相應指標的調(diào)整從而適應不同的實際情況。
技術領域
本發(fā)明公開一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法及系統(tǒng),涉及分布式自治數(shù)據(jù)庫技術領域。
背景技術
數(shù)據(jù)是任何商業(yè)和公共安全中最具有戰(zhàn)略性的資產(chǎn),信息技術領域全面云化已是大勢所趨,繼云計算大數(shù)據(jù)之后,數(shù)據(jù)庫上云也是數(shù)據(jù)庫未來的發(fā)展方向。隨著信息時代的發(fā)展,使得數(shù)據(jù)庫信息的價值及可訪問性得到了提升,對數(shù)據(jù)庫的安全性、實用性、可靠性的考驗越來越嚴峻。對傳統(tǒng)數(shù)據(jù)庫的監(jiān)控運維往往需要大量的人力物力,發(fā)生宕機情況后如處理不當或由于人為操作失誤導致數(shù)據(jù)丟失損壞,所造成的損失將是毀滅性的。為此,設計一套基于人工智能的分布式數(shù)據(jù)庫故障監(jiān)控、故障分類、故障處理的自動運維系統(tǒng)就顯得尤為重要。
目前市面上主流的第三方數(shù)據(jù)庫監(jiān)控系統(tǒng),比如普羅米修斯(Prometheus)、SolarWinds、Paessler Router Traffic Grapher等。他們的監(jiān)控功能目前已經(jīng)比較完善,但是同樣有著不足之處,出現(xiàn)問題之后沒有故障的自動處理,只有告警信息的輸出,都要靠運維人員進行維護處理。處于業(yè)務高峰期時,出現(xiàn)高頻率的告警,運維人員短時間內(nèi)無法快速處理大量問題,同時還可能出現(xiàn)操作不當,故障定位錯誤等問題。如今做到數(shù)據(jù)庫自治化的Oracle Database 18c,并沒有一套獨立的通配監(jiān)控系統(tǒng)。以上監(jiān)控系統(tǒng)對于分布式數(shù)據(jù)庫的自動化運行、故障分類、處理的作用還有待考量;
故現(xiàn)發(fā)明一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法及系統(tǒng),以解決上述問題。
發(fā)明內(nèi)容
本發(fā)明針對現(xiàn)有技術的問題,提供一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法及系統(tǒng),所采用的技術方案為:一種基于人工智能的分布式數(shù)據(jù)庫自動運維方法,所述的方法具體步驟包括:
S1對數(shù)據(jù)庫系統(tǒng)的運行信息進行采集;
S2根據(jù)監(jiān)測指標數(shù)據(jù)變化確定故障信息的相關特征;
S3利用故障信息的相關特征數(shù)據(jù)建立問題識別模型,對故障類型進行分類;
S4設定過濾器對有效信息進行收集整理篩選,得到預警信息;
S5收集預警信息并記錄對應的故障問題。
所述S1對數(shù)據(jù)庫系統(tǒng)的運行信息進行采集的具體步驟包括:
S101向數(shù)據(jù)庫接入數(shù)據(jù)庫事件和狀態(tài)信息的抓取工具
S102設置消息隊列對數(shù)據(jù)進行緩存;
S103將信息過濾處理后的數(shù)據(jù)發(fā)送至云端服務器進行AI的分析。
所述S2根據(jù)監(jiān)測指標數(shù)據(jù)變化確定故障信息的相關特征的具體步驟包括:
S201利用數(shù)據(jù)庫集群狀態(tài)的反應數(shù)據(jù)確定特定類型問題的影響指標以及數(shù)據(jù)變化量;
S202選取合適的模型進行深度學習訓練。
所述S3利用故障信息的相關特征數(shù)據(jù)建立問題識別模型,對故障類型進行分類的具體步驟包括:
S301人工輸入故障信息類型及相關數(shù)據(jù);
S302利用機器的深度學習訓練出問題識別模型;
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮云信息技術股份公司,未經(jīng)浪潮云信息技術股份公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011465354.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種充氣機裝置
- 下一篇:分布式ID的生成方法及裝置
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





