[發明專利]基于自適應滑動窗口GAN的用戶行為安全檢測方法有效
| 申請號: | 202110242716.2 | 申請日: | 2021-03-05 |
| 公開(公告)號: | CN113011476B | 公開(公告)日: | 2022-11-11 |
| 發明(設計)人: | 陶曉玲;陳隆生;趙峰;盧深;符廉銪;強保華 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 桂林文必達專利代理事務所(特殊普通合伙) 45134 | 代理人: | 張學平 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自適應 滑動 窗口 gan 用戶 行為 安全 檢測 方法 | ||
1.一種基于自適應滑動窗口GAN的用戶行為安全檢測方法,其特征在于,包括以下步驟:
利用Spark平臺對獲取的用戶數據進行并行化處理,并使用GAN分別訓練不同時間窗口下的正常用戶行為模型;
利用當前窗口長度處理獲取的待檢測數據,并將當前時刻的所述待檢測數據與上一時刻數據做屬性相似度計算;
利用所述正常用戶行為模型根據計算出的相似度值進行檢測,并將得到的異常評分與設定的閾值進行比較,判斷當前時間段是否正常;
利用當前窗口長度處理獲取的待檢測數據,并將當前時刻的所述待檢測數據與上一時刻數據做屬性相似度計算,包括:
步驟一:對用戶數據進行歸一化處理,并且初始化k為1;
對于數據x的歸一化公式:x=(x-min)/(max-min),max代表該項數據的最大值,min代表該項數據的最小值;
步驟二:對于待檢測的數據Di,根據k長度大小劃分處理Di,并根據方法similar(Di-k,D(i-1)-k)計算屬性相似度,similar(Di-k,D(i-1)-k)為相似度計算函數;
具體為:計算當前時刻數據與上一時刻數據在時間窗口為k的情況下的屬性相似度:首先將兩矩陣展平成向量,然后計算向量的乘積除以模長,其中,G為GAN的生成器,Di為待檢測數據,G(Z)為生成器生成數據,D為GAN的判別器;其中,k代表當前檢測的時間窗口長度,threshold代表異常得分判斷閾值,similar threshold代表屬性相似度判斷的閾值;
利用所述正常用戶行為模型根據計算出的相似度值進行檢測,并將得到的異常評分與設定的閾值進行比較,判斷當前時間段是否正常,包括:
若屬性相似度高于設定的閾值,則選取當前窗口大小處理數據和相應窗口大小的GAN用戶行為安全檢測模型進行異常檢測,當前窗口大小k加1;若屬性相似度低于設定的閾值,則分別結算從當前窗口大小遞減到1時的各個屬性相似度,并選取屬性相似度最低的窗口大小處理數據,并選取相應窗口大小的GAN用戶行為安全檢測模型進行異常檢測,并更新窗口大小k為選取值;具體步驟為:
如果similar(Di-k,D(i-1)-k)>similar threshold,即選取當前k作為檢測窗口長度,調用GAN-detection(Di,k)進行異常檢測,通過GAN-detection(Di,k)返回的異常得分與異常得分判斷閾值threshold作比較,若大于threshold,則表明該時刻用戶行為出現了異常;反正則表明該時刻用戶行為是正常的;k遞增1;反之,則進行異常判斷;
GAN-detection(Di,k):代表對與Di數據使用時間窗口長度為k訓練的GAN模型進行檢測,檢測異常結果返回的是該行為的異常得分,GAN-detection(Di,k)為GAN異常檢測算法;
異常得分計算方式:A(x)=(1-λ)R(x)+λD(x);
R(x)=代表重構誤差,D(x)代表判別器誤差,λ取0.9;
重構誤差:利用生成模型,來判斷生成數據G(Z)跟真實數據x的差異;首先通過訓練好的生成模型根據噪聲Z迭代500次盡可能生成最接近x的G(Z),然后通過計算G(Z)和x的數據層面的loss:LR(Z)=∑|x-G(Z)|得到重構誤差;
判別器誤差:從判別器的角度來確定生成樣本G(Z)與真實樣本x的差異;通過計算G(Z)和x在D的中間層的特征層面上的loss:LD(Z)=∑|x-G(Z)|作為判別器誤差;
異常判斷:j分別取1到5的長度計算異常得分,選取取到最小的similar(Di-j,D(i-1)-j)時的j作為檢測窗口長度,然后調用GAN-detection(Di-j,j)進行異常檢測,然后將得到的異常得分與異常得分判斷閾值threshold作比較,若大于threshold,則表明該時刻用戶行為出現了異常;反正則表明該時刻用戶行為是正常的,k更新為j。
2.如權利要求1所述的基于自適應滑動窗口GAN的用戶行為安全檢測方法,其特征在于,利用Spark平臺對獲取的用戶數據進行并行化處理,并使用GAN分別訓練不同時間窗口下的正常用戶行為模型,包括:
利用Spark平臺對獲取的用戶數據進行并行化處理,并對每個所述用戶數據進行屬性提取和歸一化處理;
基于設定的數據時間段,構建對應的訓練集,并基于所述訓練集,利用GAN分別對時間窗口長度為1、2、3、4、5的正常用戶行為模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110242716.2/1.html,轉載請聲明來源鉆瓜專利網。





