[發明專利]一種基于機器學習的離群資產檢測方法及系統在審
| 申請號: | 202111194965.5 | 申請日: | 2021-10-14 |
| 公開(公告)號: | CN113641682A | 公開(公告)日: | 2021-11-12 |
| 發明(設計)人: | 韓旭東;曲志峰;張勝猛;高峰 | 申請(專利權)人: | 中孚安全技術有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458;G06K9/62;G06N20/00 |
| 代理公司: | 濟南舜源專利事務所有限公司 37205 | 代理人: | 趙陽 |
| 地址: | 250101 山東省濟南市高新*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 離群 資產 檢測 方法 系統 | ||
1.一種基于機器學習的離群資產檢測方法,其特征在于,包括如下步驟:
S1:對資產基本信息進行預處理,形成資產統計信息,并存儲到資產統計表中;
S2:把資產統計信息作為離群資產算法模型的輸入信息,應用離群資產算法模型,生成不屬于任何簇的離群資產信息;
S3:把離群資產信息寫入離群資產表。
2.根據權利要求1所述的基于機器學習的離群資產檢測方法,其特征在于,所述資產基本信息包括:
資產信息、資產漏洞信息、資產告警信息和資產訪問信息。
3.根據權利要求2所述的基于機器學習的離群資產檢測方法,其特征在于,所述步驟S1具體為:
對資產信息、資產漏洞信息、資產告警信息、資產訪問信息基于資產ID進行關聯;基于資產ID和資產狀態分組聚合生成資產統計信息;
把資產統計信息存儲到資產統計表中。
4.根據權利要求1所述的基于機器學習的離群資產檢測方法,其特征在于,所述離群資產算法模型采用K-Means聚類算法,K-Means聚類算法的聚類個數K設置為6,K-Means聚類算法采用的距離函數為歐幾里得距離函數。
5.根據權利要求4所述的基于機器學習的離群資產檢測方法,其特征在于,所述K-Means聚類算法具體包括:
將需要度量樣本之間的距離,用p個資產屬性來表示n個樣本的數據矩陣如下:
其中,x代表資產統計信息屬性的取值,xnp代表第n個資產的第p個屬性,資產屬性包括資產狀態、資產漏洞數、資產告警數和資產訪問數;
度量資產之間的相似性采用歐幾里得距離函數,具體如下:
其中,d(
6.根據權利要求4所述的基于機器學習的離群資產檢測方法,其特征在于,所述步驟S2具體包括:
S21:從資產統計表中隨機選取K個資產統計對象作為初始的聚類中心;
S22:分別計算每個資產統計對象到各個聚類中心的距離,將對象分配到距離最近的聚類中;
S23:所有資產統計對象分配完成后,重新計算K個聚類中心;
S24:將本次計算得到的K個聚類中心與前一次計算得到的K個聚類中心比較,判斷聚類中心是否發生變化,若是,則轉到步驟S22,否則轉到步驟S25;
S25:輸出聚類結果;
S26:計算每個聚類的正常半徑;
S27:從每個聚類中,找出大于正常半徑的點,即離群點,并從聚類中剔除,形成不屬于任何簇的離群資產信息。
7.根據權利要求6所述的基于機器學習的離群資產檢測方法,其特征在于,所述聚類的正常半徑為聚類的平均距離與1.5倍標準差之和。
8.根據權利要求1所述的基于機器學習的離群資產檢測方法,其特征在于,所述步驟S3包括:
使用預設的離群資產的數據結果進行離群資產信息的整理,形成離群資產;
把離群資產寫入離群資產表。
9.一種基于機器學習的離群資產檢測系統,其特征在于,包括:
資產數據存儲庫,用于存儲資產基本信息、離群資產信息,以及對資產基本信息進行信息預處理生成的資產統計信息;
計算單元,用于把資產統計信息作為離群資產算法模型的輸入信息,應用離群資產算法模型,生成不屬于任何簇的離群資產信息。
10.根據權利要求9所述的基于機器學習的離群資產檢測系統,其特征在于,所述資產數據存儲庫包括:
資產信息存儲單元,用于使用資產信息表存儲資產信息,資產信息表的數據項包括資產ID、資產名稱、資產狀態和登記時間;
資產漏洞信息存儲單元,用于使用資產漏洞表存儲資產的漏洞信息,資產漏洞表的數據項包括主鍵、資產ID、漏洞類型和漏洞檢測時間,資產漏洞表的資產ID與資產信息表的資產ID關聯;
資產告警信息存儲單元,用于使用資產告警表存儲資產的監控告警信息,資產告警表的數據項包括主鍵、資產ID、告警類型和告警時間,資產告警表的資產ID與資產信息表的資產ID關聯;
資產訪問信息存儲單元,用于使用資產訪問表存儲資產對外訪問或訪問該資產的訪問信息,資產訪問表的數據項包括主鍵、資產ID、訪問類型和訪問時間;
資產統計信息存儲單元,用于使用資產統計表存儲經過預處理的資產統計信息,資產統計表的數據項包括主鍵、統計日期,資產ID、資產狀態、漏洞個數、告警個數、訪問次數等,資產統計表的資產ID與資產信息表的資產ID關聯;
離群資產信息存儲單元,用于使用離群資產表存儲經過離群資產算法模型形成的不屬于任何簇的離群資產信息,離群資產表的數據項包括主鍵、資產ID,資產名稱、檢測時間,異常描述和處置狀態。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中孚安全技術有限公司,未經中孚安全技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111194965.5/1.html,轉載請聲明來源鉆瓜專利網。





