[發明專利]基于共同序列模式的、用于智能客戶服務的分析系統和方法有效
| 申請號: | 201210439999.0 | 申請日: | 2012-10-29 |
| 公開(公告)號: | CN103793284B | 公開(公告)日: | 2017-06-20 |
| 發明(設計)人: | 陳超;付宇;鐘錢杰;劉晶晶;陳齊彥 | 申請(專利權)人: | 伊姆西公司 |
| 主分類號: | G06F11/00 | 分類號: | G06F11/00 |
| 代理公司: | 北京市金杜律師事務所11256 | 代理人: | 王茂華 |
| 地址: | 美國馬*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 共同 序列 模式 用于 智能 客戶 服務 分析 系統 方法 | ||
技術領域
本發明涉及信息分析領域,更具體地,涉及一種基于共同序列模式的分析系統和方法。
背景技術
隨著計算機技術的不斷發展,經常存在需要在多個系統中部署產品組件的情形。一旦出現錯誤(error),針對復雜產品組件的分析是耗時以及復雜的工作(即使對于簡單的產品部署來說也是如此)。相關信息(例如應用日志、系統日志/事件)被放置在若干主機/組件、實例中。如何分析信息并找到錯誤的根源是極富挑戰性的工作。
現有的方法一般通過查看單個案例的單個日志文件來查找問題,這不能檢測事件序列并獲得有用信息。在復雜的多生產環境中,找到問題根源非常困難,尤其是在存在多個噪聲信息時尤其如此。歷史性日志不能用于未來的診斷和對嚴重問題的預防。之前的信息在分析之后不能以適當形式保存。可以看到,要從復雜的事件中獲得問題的根源而不比較不同的日志信息是非常困難的。
發明內容
為了解決現有技術中存在的上述問題,本發明提出如下方案。
根據本發明的第一方面,提供一種信息分析方法,包括:基于源信息集合生成元數據集合,所述元數據包括錯誤日志信息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及為多個所述元數據集合生成共同錯誤序列集合。
根據本發明的第二方面,提供一種信息分析系統,包括:預處理裝置,用于基于源信息集合生成元數據集合,所述元數據包括錯誤日志信息,所述錯誤日志信息在所述元數據集合中構成錯誤序列;以及共同序列生成裝置,用于為多個所述元數據集合生成共同錯誤序列集合。
附圖說明
圖1是示出了根據本發明的、用于信息分析的方法100的流程圖。
圖2是示出了根據本發明實施方式的、用于生成元數據集合的示例圖。
圖3是示出了根據本發明實施方式的、用于生成共同錯誤序列集合的示例圖。
圖4是示出了根據本發明的、用于信息分析的系統400的框圖。
圖5是示出了適于用來實踐本發明實施方式的計算機系統500的示意性框圖
應當注意,附圖中的流程圖和框圖,圖示了按照本發明各種實施例的裝置、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發生。例如,兩個接連地表示的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或操作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
具體實施方式
下面將參考若干示例性實施方式來描述本發明的原理和精神。應當理解,給出這些實施方式僅僅是為了使本領域技術人員能夠更好地理解進而實現本發明,而并非以任何方式限制本發明的范圍。
為了對信息進行分析,首先應當采集作為分析基礎的信息。針對分析所采集的信息包括例如來自不同的客戶環境的不同的源的應用程序日志、系統事件/日志、流程/線程堆棧、用戶/應用記錄等。術語“日志”用來表示所有這類信息,大多數“日志”為非結構化數據。而“錯誤日志信息”用于表示“日志”中與錯誤有關的信息。要注意的是,這里所稱的術語“錯誤(error)”是廣義的,其可以包括運行時錯誤(runtime error)、警告(warn)、調試信息(DEBUG)以及I NFO等等各種級別的與出錯或潛在的危險有關的信息,并且其還可以隨時由用戶來調整其所覆蓋的范圍。
在日志中存在的錯誤日志信息的特點可以歸納如下:
1.重復性:如果錯誤是由軟件問題所引起的,則它們會在客戶的環境中發生,并且該問題會被報告多次。
2.因果關系:如果在特定序列中若干錯誤頻繁發生,則它們在很大程度上具有因果關系;
3.分布性:日志分布在若干主機/組件/實例中,一些由生產、中間件所產生,另一些由操作系統OS(如Windows事件)或CPU/存儲器/網絡的系統日志所產生。
4.前兆性:許多錯誤不會突然地發生,它們具有一些前兆性的錯誤或者警告事件。
5.滯后性:許多錯誤不會立即停止,而是會引起后續的錯誤。
6.嚴重性:通常較早期的錯誤具有較小的破壞性,而較后期的錯誤則具有較大的破壞性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于伊姆西公司,未經伊姆西公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210439999.0/2.html,轉載請聲明來源鉆瓜專利網。





