[發明專利]基于日志事件關系生成KPI曲線并標記波段特征的方法有效
| 申請號: | 202210292597.6 | 申請日: | 2022-03-24 |
| 公開(公告)號: | CN114398898B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 戴曦;尹立超;徐旭朝 | 申請(專利權)人: | 三峽智控科技有限公司 |
| 主分類號: | G06F40/295 | 分類號: | G06F40/295;G06F40/216;G06F40/194;G06F16/35 |
| 代理公司: | 武漢宇晨專利事務所(普通合伙) 42001 | 代理人: | 龐寬 |
| 地址: | 430000 湖北省武漢*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 日志 事件 關系 生成 kpi 曲線 標記 波段 特征 方法 | ||
1.基于日志事件關系生成KPI曲線的方法,其步驟包括:
步驟F1.設置訓練句子組成的訓練句子集,同一工控系統中工控設備基于監測指標獲得故障日志,將故障日志中的語料分別與各訓練句子組成待處理句子對,并計算相似度,刪除相似度低于閾值一的語料;
步驟F2.對步驟F1中的剩余語料進行分詞,生成由多個特征詞組成的分詞隊列,并對多個特征詞標注詞性,獲得語料的詞性隊列;
步驟F3.若詞性隊列含有對應特殊詞性的多個特殊特征詞,則利用命名實體識別模型從多個特殊特征詞中獲得命名實體的邊界及類別,將詞性隊列中特殊特性詞的詞性更新為命名實體的邊界及類別,獲得更新后的詞性隊列,其中,特殊詞性包括:數詞、時間詞;
步驟F4.根據F3對剩余語料的標注對剩余語料分類,統計各類別詞性隊列的出現頻次,降序排序,挑選出排序大于閾值二的詞性隊列,統計各類別詞性隊列中各種動詞、名詞的出現頻次,并進行降序排序,根據排序閾值依次從按動詞、名詞的出現頻次的排序中篩選出排名靠前的兩種詞性隊列集合,提取兩種詞性隊列集合的交集對應的語料,構建真訓練集;
步驟F5.從真訓練集的語料中篩選出含有詞性標注組合為[n,v,n]的分詞隊列,n表示名詞的詞性,v表示動詞的詞性,并從中提取出詞性為名詞或專有名詞的第一個和第二個分詞分別作為事件一和事件二,形成事件元組;
步驟F6. 基于現有的故障事件關系表,使用Snowball算法發現事件元組的事件關聯規則,根據事件關聯規則發現事件元組中的關聯事件組,即生成日志關鍵事件關系表;
步驟F7. 基于日志關鍵事件關系表重復使用步驟F6直至收斂;
步驟F8.以步驟F7生成的每種事件關系作為一種日志關鍵事件標簽標記故障日志,以各日志關鍵事件標簽標每分鐘出現的次數作為監測指標,建立各個日志KPI曲線,使用高斯核平滑處理各個日志KPI曲線;
步驟A1.將全部的日志KPI曲線中各分鐘的數據點集合并,再分割成時間寬度為s分鐘的若干段波段,根據波段的非時間維度聚類成多個簇,提取各個簇的基波,比較各個簇的各波段數據與基波的相似度,找出各個簇的分組邊界線,將各個簇的各波段數據分組;
步驟A2.提取被分到不同分組中的各段日志KPI曲線數據集的時間戳,得到每個分組的時間戳列表;
步驟A3.將每組的時間戳列表做移步相減,即使用各時間戳列表中下一項的起始時間戳與本項的起始時間戳相減獲得事件觸發間隔列表;
步驟A4.將各簇的事件觸發間隔合并成時間間隔KPI集,依據NCC計算各簇的時間間隔KPI集之間的相似度;
步驟A5.將步驟A4獲得的各簇之間時間間隔KPI集的相似度展開成相似度矩陣;
步驟A6.使各簇之間時間間隔KPI集的相似度按數值大小依次排序,然后將相似度的數值擬合成平滑線,依據拐點法獲得各簇之間時間間隔KPI集的相似度的分界線;
步驟A7.將相似度矩陣中數值大于拐點的且相鄰的簇標記為同一個相似組,統計各相似組的簇數;
步驟A8.計算相似組中簇數最多的一組的總時間間隔,作為滑動窗口寬度;
步驟A9.先按步驟A8獲得的滑動窗口,將各個日志KPI曲線分割成時序寬度為總時間間隔的若干段日志KPI曲線窗口段,按步驟A1的分割方法將日志KPI曲線窗口段分割成時序寬度為1分鐘的i段日志KPI曲線數據集,每一段是一個波段;
將步驟A1得到的各基波逐一與每一條日志KPI曲線的每一個窗口內的各波段比較相似度,并相似度從大到小排序,依據排序找出分組邊界線,將波段分組,形成基波標簽構成的標簽鏈,獲取不同KPI的模式波形,稱為KPI曲線碼型重排表;
步驟A10. 將不同的KPI曲線碼型重排表統一時間維度放置在一個維度中,獲得KPI曲線碼型重排關聯表。
2.根據權利要求1所述的方法,其特征在于,步驟F1中計算相似度包括以下步驟:基于預構建的語料庫對句子對中的句子分別進行分詞,其中,預構建的語料庫包括行業語料庫和普通語料庫;
將分詞后句子的各特征詞轉化為詞向量,并使用余弦相似度分別計算各句子對的相似度,若相似度低于閾值一則刪除該語料。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于三峽智控科技有限公司,未經三峽智控科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210292597.6/1.html,轉載請聲明來源鉆瓜專利網。





