[發明專利]一種基于工業系統的多源異構數據處理系統與方法有效
| 申請號: | 202111355901.9 | 申請日: | 2021-11-16 |
| 公開(公告)號: | CN114003596B | 公開(公告)日: | 2022-07-12 |
| 發明(設計)人: | 許豐娟;李俊;郝志強;高建磊;李耀兵;江浩;鞏天宇;趙千;李赟 | 申請(專利權)人: | 國家工業信息安全發展研究中心 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06F16/2455;H04L9/40 |
| 代理公司: | 北京高沃律師事務所 11569 | 代理人: | 劉芳 |
| 地址: | 100040 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 工業 系統 多源異構 數據處理系統 方法 | ||
1.一種基于工業系統的多源異構數據處理系統,其特征在于,包括:
多路數據采集端,用于采集工業系統中各設備的數據;工業系統中的設備包括:工業主機設備、生產控制設備、網絡設備、安全設備、辦公設備和工業輔助設備;
采集預處理終端,與所述多路數據采集端連接,用于對采集的工業系統中各設備的數據進行預處理;所述預處理包括:編碼處理、分類處理和漏洞數據檢測;
邊緣計算模塊,與所述采集預處理終端連接,用于對預處理后的數據進行數據清洗、篩選和加密處理;
云數據中心,分別與所述采集預處理終端和所述邊緣計算模塊連接,用于存儲預處理后的數據和經數據清洗、篩選和加密處理的數據;
所述采集預處理終端包括:
編碼單元,與所述多路數據采集端連接,用于對采集的工業系統中各設備的數據進行編碼,得到編碼數據;
分類單元,與所述編碼單元連接,用于對所述編碼數據進行分類,得到分類數據;所述分類數據包括:控制數據、網絡數據、平臺數據、日志數據、流量數據、資產數據、工具數據、生產數據或漏洞數據;
多個緩沖區的緩存單元,分別與所述分類單元和所述邊緣計算模塊連接,用于緩存所述分類數據,并當任一緩存區滿時將緩存的所述分類數據傳輸給所述邊緣計算模塊,同時清除滿緩存區內緩存的數據;
漏洞檢測單元,與所述分類單元和所述云數據中心連接,用于檢測所述分類數據中是否存在漏洞數據,當存在漏洞數據時,對存在的漏洞數據進行加密后上傳給所述云數據中心,同時生成報警信號;
所述邊緣計算模塊包括:
數據清洗單元,與所述采集預處理終端連接,用于對預處理后的數據進行數據清洗;
數據補充單元,與所述數據清洗單元連接,用于采用插值法對清洗后的數據進行補充,得到補充數據;所述插值法包括:隨機插值法與線性插值法;
數據篩選單元,與所述數據清洗單元連接,用于采用基于分布度量的下采樣方法對所述補充數據進行篩選,得到有用數據;
加密單元,與所述數據篩選單元連接,用于對所述有用數據進行加密;
所述數據篩選單元包括:
數據距離確定子單元,與所述數據補充單元連接,用于采用歐氏距離度量所述補充數據中任意兩個數據間的距離;
分布度量確定子單元,與所述數據距離確定子單元連接,用于基于所述補充數據中各數據的鄰域根據所述距離確定各數據的分布度量;所述鄰域為以所述補充數據中任一數據點為中心,以預設值為半徑形成的超球體;
數據排序子單元,與所述分布度量確定子單元連接,用于基于所述分布度量將所述補充數據中各數據降序排列,得到排列數據;
第一判斷子單元,與所述數據排序子單元連接,用于判斷所述排列數據中每一數據的分布度量是否大于預設閾值,得到第一判斷結果;
第一有用數據確定子單元,與所述判斷子單元連接,用于當所述第一判斷結果為分布度量大于所述預設閾值時,保留與該分布度量對應的數據,并判定為有用數據;
第二判斷子單元,與所述判斷子單元連接,用于當所述第一判斷結果為分布度量小于等于所述預設閾值時,判斷與該分布度量對應的數據是否在已有有用數據的鄰域內,得到第二判斷結果;
第二有用數據確定子單元,與所述第二判斷子單元連接,用于當所述第二判斷結果為該分布度量對應的數據不在已有有用數據的鄰域內時,確定與該分布度量對應的數據為有用數據;
冗余數據確定子單元,與所述第二判斷子單元連接,用于當所述第二判斷結果為該分布度量對應的數據在已有有用數據的鄰域內時,確定與該分布度量對應的數據為有用數據。
2.根據權利要求1所述的基于工業系統的多源異構數據處理系統,其特征在于,還包括:
報警模塊,與所述漏洞檢測單元連接,用于接收所述報警信號后發出報警;接收報警信號的方式為短信、郵件或警報方式。
3.根據權利要求1所述的基于工業系統的多源異構數據處理系統,其特征在于,所述多個緩沖區包括:生產數據緩存區、控制數據緩存區、日志數據緩存區、網絡數據緩存區、流量數據緩存區、資產數據緩存區、工具數據緩存區、平臺數據緩存區和漏洞數據緩存區。
4.一種基于工業系統的多源異構數據處理方法,其特征在于,包括:
采集工業系統中各設備的數據;工業系統中的設備包括:工業主機設備、生產控制設備、網絡設備、安全設備、辦公設備和工業輔助設備;
對采集的工業系統中各設備的數據進行預處理;所述預處理包括:編碼處理、分類處理和漏洞數據檢測;
采用邊緣計算模塊對預處理后的數據進行數據清洗、篩選和加密處理;
采用云數據中心存儲預處理后的數據和經數據清洗、篩選和加密處理的數據;
所述對采集的工業系統中各設備的數據進行預處理,具體包括:
對采集的工業系統中各設備的數據進行編碼,得到編碼數據;
對所述編碼數據進行分類,得到分類數據;所述分類數據包括:控制數據、網絡數據、平臺數據、日志數據、流量數據、資產數據、工具數據、生產數據或漏洞數據;
緩存所述分類數據,并當緩存滿時將緩存的所述分類數據傳輸給所述邊緣計算模塊,同時清除滿緩存區內緩存的數據;
檢測所述分類數據中是否存在漏洞數據,當存在漏洞數據時,對存在的漏洞數據進行加密后上傳給所述云數據中心,同時生成報警信號;
所述對預處理后的數據進行數據清洗、篩選和加密處理,具體包括:
對預處理后的數據進行數據清洗;
采用插值法對清洗后的數據進行補充,得到補充數據;
采用基于分布度量的下采樣方法對所述補充數據進行篩選,得到有用數據;
對所述有用數據進行加密;
所述采用基于分布度量的下采樣方法對所述補充數據進行篩選,得到有用數據,具體包括:
采用歐氏距離度量所述補充數據中任意兩個數據間的距離;
基于所述補充數據中各數據的鄰域根據所述距離確定各數據的分布度量;所述鄰域為以所述補充數據中任一數據點為中心,以預設值為半徑形成的超球體;
基于所述分布度量將所述補充數據中各數據降序排列,得到排列數據;
判斷所述排列數據中每一數據的分布度量是否大于預設閾值,得到第一判斷結果;
當所述第一判斷結果為分布度量大于所述預設閾值時,保留與該分布度量對應的數據,并判定為有用數據;
當所述第一判斷結果為分布度量小于等于所述預設閾值時,判斷與該分布度量對應的數據是否在已有有用數據的鄰域內,得到第二判斷結果;
當所述第二判斷結果為該分布度量對應的數據不在已有有用數據的鄰域內時,確定與該分布度量對應的數據為有用數據;
當所述第二判斷結果為該分布度量對應的數據在已有有用數據的鄰域內時,確定與該分布度量對應的數據為有用數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家工業信息安全發展研究中心,未經國家工業信息安全發展研究中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111355901.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:工業大風扇全自動激光檢測儀以及檢測方法
- 下一篇:一種蜜蜂飼料及其制備方法





