[發明專利]一種基于無監督學習的數據庫異常訪問檢測方法在審
| 申請號: | 201911010410.3 | 申請日: | 2019-10-23 |
| 公開(公告)號: | CN110866030A | 公開(公告)日: | 2020-03-06 |
| 發明(設計)人: | 汪秋云;王旭仁;羅蒙;方舟;王棟 | 申請(專利權)人: | 中國科學院信息工程研究所;國網浙江省電力有限公司信息通信分公司;國網電子商務有限公司 |
| 主分類號: | G06F16/242 | 分類號: | G06F16/242;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100093 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 學習 數據庫 異常 訪問 檢測 方法 | ||
1.一種基于無監督學習的數據庫異常訪問檢測方法,其步驟包括:
1)對于歷史審計日志中的各查詢記錄,分別提取每一查詢記錄中的特征并根據所提取的特征生成對應用戶的行為輪廓;
2)對各用戶的行為輪廓進行聚類,并將聚類的結果標記為對應用戶的用戶組別;
3)利用標記了用戶組別的行為輪廓進行訓練,得到異常檢測模塊;
4)對于用戶提交到數據庫的一查詢語句,提取該查詢語句中的特征;根據所提取的特征生成該用戶的行為輪廓并將其輸入到訓練后的異常檢測模塊中進行檢測,確定是否為異常訪問。
2.如權利要求1所述的方法,其特征在于,所述特征包括:查詢命令類型、查詢語句檢索與操作的屬性、查詢檢索的數據表。
3.如權利要求1或2所述的方法,其特征在于,所述行為輪廓為向量V(C,T,A,R);其中,C為語句命令類型,T為查詢檢索的數據表,A為查詢語句檢索的屬性信息,R為查詢結果所占的比例。
4.如權利要求3所述的方法,其特征在于,構造一向量Q(Cm,Pr,Pa,Sr)用于驗證向量V(C,T,A,R);其中,Cm表示用戶命令類型,Pr表示檢索表向量,Pa表示檢索屬性,Sr表示檢索信息的比例。
5.如權利要求3所述的方法,其特征在于,A為一個向量,向量的長度為所有數據表長度中的最大值,屬性與向量之間的映射方式為:當查詢中包含數據表中的某個屬性時,將向量中該屬性所在位設為1,否則為0;R為查詢結果的行數與數據表的總行數之比。
6.如權利要求1所述的方法,其特征在于,使用貝葉斯定理對標記了用戶組別的行為輪廓進行訓練,得到所述異常檢測模塊,其方法為:
311)計算訓練數據集T={(x1,y1),(x2,y2),…,(xn,yn)}的先驗概率分布P(Y=yj);其中,(xn,yn)為第n個樣本數據,yn為第n個樣本數據的類別,xn為第n個樣本數據的行為輪廓,xn={V1,V2,…,Vm},Vi為xn的第i項特征屬性;
312)計算訓練數據集T中各類別下每個特征屬性的條件概率分布P(Vi|yj);
313)計算特征x的類別為yj的概率P(yj|x);其中,x代表x1~xn中任意一特征;
314)根據步驟313)的計算結果,若有P(yk|x)=max{P(y1|x),P(y2|x),…,P(yn|x)},則x∈yk,即特征x屬于輸出類別yk。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所;國網浙江省電力有限公司信息通信分公司;國網電子商務有限公司,未經中國科學院信息工程研究所;國網浙江省電力有限公司信息通信分公司;國網電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911010410.3/1.html,轉載請聲明來源鉆瓜專利網。





