[發明專利]一種基于詞頻與逆文檔頻率的工控系統異常診斷信息識別方法在審
| 申請號: | 202010733364.6 | 申請日: | 2020-07-27 |
| 公開(公告)號: | CN111857097A | 公開(公告)日: | 2020-10-30 |
| 發明(設計)人: | 李少森;梁鈺華;孫豪;黃劍湘;楊光;李浩;張啟浩;任君;楊鋮;丁丙侯 | 申請(專利權)人: | 中國南方電網有限責任公司超高壓輸電公司昆明局 |
| 主分類號: | G05B23/02 | 分類號: | G05B23/02;G06F40/289 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 王華強 |
| 地址: | 650217 云南省*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 詞頻 文檔 頻率 系統 異常 診斷 信息 識別 方法 | ||
本發明揭示一種基于詞頻與逆文檔頻率的工控系統異常診斷信息識別方法,包括:建立診斷命令的響應語料庫;再次向被測系統發送診斷命令,獲得第N+1份回顯報文;對所有回顯報文進行過濾停用詞、分詞處理;利用TF?IDF詞頻與逆文檔頻率算法,計算所有回顯報文的每組文本列表中每個詞的逆文檔頻率IDF;設置最低逆文檔頻率閾值IDFmin,刪除不大于IDFmin的詞;將過濾的N+1份回顯報文的文本列表建立詞組列表V,并計算出詞頻值;設置詞頻閾值,將計算出的詞頻值與設置的詞頻閾值進行比較,來判斷異常。本發明的算法可通過自學習方式定義每條診斷命令回顯信息的健康度,可大幅度降低工控監測系統的人工開發成本,提高事件判斷及時性。
技術領域
本發明涉及工控系統異常診斷技術領域,具體地,涉及一種基于詞頻與逆文檔頻率的工控系統異常診斷信息識別方法。
背景技術
目前,部分工控系統基于遠程管理實現運維,不提供屏幕、按鍵等本地操作界面供現場運維人員交互,必須使用調試電腦接入,以調試軟件/瀏覽器等方式與裝置互動,以查看、分析系統問題。一旦出現通道或裝置異常事件,現場運維人員只能根據其他業務系統的通道中斷告警、遠程監控中心(如各級調度主站等)的運維人員反饋獲悉,然后使用調試電腦接入工控系統檢查、分析異常原因并處理。如果遠程監控未注意到異常,則只能等現場運維人員定期運維、配置備份時才能發現,故障處理普遍滯后不及時。由于工控系統的異常存在隨機性,人工定期查看分析難以抓住異常瞬間的詳細信息,因此隨著時間推移,其異常分析的質量越低。
發明內容
針對現有技術的不足,本發明提供一種基于詞頻與逆文檔頻率的工控系統異常診斷信息識別方法,解決現有技術中工控系統異常分析質量低下的問題。
本發明公開的一種基于詞頻與逆文檔頻率的工控系統異常診斷信息識別方法,包括以下步驟:
步驟1:建立診斷命令的響應語料庫:向被測系統發送診斷命令N次,將獲得的N份回顯報文按時間順序排列,作為診斷命令的響應語料庫;
步驟2:再次向被測系統發送診斷命令,獲得第N+1份回顯報文,將所述第N+1份回顯報文添加至步驟1建立的診斷命令語料庫的最后;
步驟3:對N+1份回顯報文進行過濾停用詞、分詞處理;
步驟4:利用利用TF-IDF詞頻與逆文檔頻率算法,計算N+1份回顯報文中每組文本列表中每個詞的逆文檔頻率IDF;
步驟5:設置最低逆文檔頻率閾值IDFmin,步驟4中計算的每組文本列表的詞的逆文檔頻率IDF若小于等于IDFmin值,則予以刪除;
步驟6:將步驟5完成過濾的N+1份回顯報文的文本列表向量化:提取出N+1組文本列表內的所有詞組,去除重復后獲得長度為M的詞組表V,其中M等于完成去除重復過濾的詞組總數,V代表完成過濾的N+1組文本列表內出現的所有詞組,然后將完成過濾的N+1組文本列表按V中詞匯的排序對文本列表的詞重新排序,然后詞組轉換為向量,向量大小為該詞在其所在回顯報文中出現的次數,并計算出詞頻值
步驟7:設置詞頻閾值tfmax,將步驟6計算出來的詞頻值值與設置的詞頻閾值tfmax進行比較,若則識別為異常報文,并輸出告警信息。
根據本發明的一實施方式,步驟1中的診斷命令發送時間間隔為T,T的取值范圍根據診斷命令返回結果可能發生變化的時間范圍而定,在系統資源不會突變的情況下T的取值范圍為1~30天;在網絡通道隨時可能中斷的情況下T的取值范圍為1s~24h。
根據本發明的一實施方式,步驟3中停用詞包括日期和時間。
根據本發明的一實施方式,日期格式為yyy-mm-dd,時間格式為hh:mm:ss、h:mm。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國南方電網有限責任公司超高壓輸電公司昆明局,未經中國南方電網有限責任公司超高壓輸電公司昆明局許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010733364.6/2.html,轉載請聲明來源鉆瓜專利網。





