[發明專利]一種基于會話特征相似性模糊聚類的異常用戶檢測方法有效
| 申請號: | 201810398688.1 | 申請日: | 2018-04-27 |
| 公開(公告)號: | CN108595655B | 公開(公告)日: | 2022-04-01 |
| 發明(設計)人: | 肖如良;蘇家威;蔡聲鎮;林鑫泓;許力 | 申請(專利權)人: | 福建師范大學 |
| 主分類號: | G06F16/95 | 分類號: | G06F16/95;G06V10/762;G06K9/62 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350117 福建省福州市閩侯縣*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 會話 特征 相似性 模糊 異常 用戶 檢測 方法 | ||
1.一種基于會話特征相似性模糊聚類的異常用戶檢測方法,其特征在于,包括以下步驟:
步驟S1:為每個會話建立滑動窗口,收集用戶的網頁訪問信息;
步驟S2:對收集到的網頁訪問信息進行數據預處理,生成用戶會話信息;
步驟S3:采用PageRank算法計算網頁權重信息;
步驟S4:基于得到的用戶會話信息和網頁權重信息,采用SimHash算法計算用戶之間的相似性,建立用戶相似性矩陣;
步驟S5:采用基于模糊聚類的
步驟S6:根據所有會話滑動窗口返回的嫌疑用戶信息,檢測并定位異常用戶;
基于模糊聚類的λ-截算法為:構造模糊矩陣,然后采用λ-截矩陣對模糊矩陣進行λ-截算法,以實現聚類;
設存在用戶集合U={X1,X2 ,X3 ,X4 ,X5},采用以下的模糊矩陣
λ-截矩陣的定義如下式:
采用各種λ對模糊矩陣進行λ-截算法,得到的聚類結果為:
當
當
當
當
2.根據權利要求1所述的一種基于會話特征相似性模糊聚類的異常用戶檢測方法,其特征在于,所述步驟S2中,對收集到的網頁訪問信息進行數據預處理,包括以下步驟:
步驟S21:對網頁訪問信息進行數據清理,只保留html和htm的訪問記錄;
步驟S22:設定同一個IP地址為同一個用戶,采用基于時間閾值的啟發式方法對步驟S21處理后的訪問記錄進行處理,即如果單個用戶在某個頁面上的停留時間超過設定閾值,則將該訪問記錄劃分為新的會話,從而得到如下的用戶會話數據集:
{
其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福建師范大學,未經福建師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810398688.1/1.html,轉載請聲明來源鉆瓜專利網。





