[發明專利]一種用戶異常請求檢測方法、裝置、設備及存儲介質在審
| 申請號: | 202111277187.6 | 申請日: | 2021-10-29 |
| 公開(公告)號: | CN113901441A | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 禹慶華 | 申請(專利權)人: | 上海微盟企業發展有限公司 |
| 主分類號: | G06F21/50 | 分類號: | G06F21/50;G06V10/762 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 趙菲 |
| 地址: | 200441 上海市寶山*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用戶 異常 請求 檢測 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種用戶異常請求檢測方法、裝置、設備及存儲介質,包括:獲取預設時段內不同用戶的請求頻次數據,將每個用戶的所述請求頻次數據按照時間順序進行排列生成時序序列;利用改進后的能夠度量時序數據之間相似度的無監督算法對不同用戶的所述時序序列進行處理,得到第一聚類結果;根據所述第一聚類結果中各個簇的用戶數量確定在所述預設時段內存在異常請求的用戶。本申請僅需獲取請求頻次的時序數據無需其他特殊屬性數據,保障用戶隱私,進而利用改進后的能夠度量時序數據之間相似度的無監督算法從時序維度進行特征工程分析,避免因單次異常行為產生誤判從而提高異常請求檢測精度,同時也能夠識別出具有相同異常行為的用戶群體。
技術領域
本發明涉及網絡安全技術領域,特別涉及一種用戶異常請求檢測方法、裝置、設備及存儲介質。
背景技術
在當前互聯網世界,電商平臺或其他一些有價值網站經常遭到一些不法分子(黑產)通過技術手段薅羊毛(優惠券等)、刷投票以及爬取網站有價值數據,甚至惡意攻擊網站。現有技術中主要通過請求日志和前端界面打點日志,包括抓取用戶的點擊行為、電池屬性、陀螺儀、屏幕分辨率、設備指紋、cookie等數據來進行數據分析。一方面,這些數據需要額外耗費人力物力去獲取,使得成本偏高。另一方面,獲取的數據過多意味著用戶的隱私數據暴露的也越多,存在隱私泄露的風險。
因此,如何安全、準確地對用戶的異常請求進行檢測是本領域技術人員亟待解決的技術問題。
發明內容
有鑒于此,本發明的目的在于提供一種用戶異常請求檢測方法、裝置、設備及存儲介質,避免因單次異常行為產生誤判從而提高異常請求檢測精度,同時也能夠識別出具有相同異常行為的用戶群體。其具體方案如下:
本申請的第一方面提供了一種用戶異常請求檢測方法,包括:
獲取預設時段內不同用戶的請求頻次數據,并將每個用戶的所述請求頻次數據按照時間順序進行排列生成與每個用戶對應的時序序列;
利用改進后的能夠度量時序數據之間相似度的無監督算法對不同用戶的所述時序序列進行處理,以得到第一聚類結果;
根據所述第一聚類結果中各個簇的用戶數量確定在所述預設時段內存在異常請求的用戶。
可選的,所述用戶異常請求檢測方法,還包括:
獲取不同用戶的請求日志;
根據所述請求日志確定不同用戶對應的每秒查詢率QPS,并將所述每秒查詢率QPS存儲至預設數據庫中;
相應的,所述獲取預設時段內不同用戶的請求頻次數據,包括:
從所述預設數據庫中提取所述預設時段內不同用戶反映請求頻次的所述每秒查詢率QPS。
可選的,所述將每個用戶的所述請求頻次數據按照時間順序進行排列生成與每個用戶對應的時序序列之后,還包括:
將每個用戶的所述時序序列進行組合生成對應的特征矩陣,以便基于所述特征矩陣進行聚類分析。
可選的,所述利用改進后的能夠度量時序數據之間相似度的無監督算法對不同用戶的所述時序序列進行處理,以得到第一聚類結果,包括:
將動態時間規整DTW作為相似度度量算法集成至Kmeans算法模型中,以得到改進后的Kmeans算法模型;
利用改進后的Kmeans算法模型對所述特征矩陣進行處理,以得到所述第一聚類結果。
可選的,所述根據所述第一聚類結果中各個簇的用戶數量確定在所述預設時段內存在異常請求的用戶之前,還包括:
利用DBSCAN聚類算法對所述特征矩陣進行處理得到第二聚類結果,以便根據所述第一聚類結果和所述第二聚類結果確定在所述預設時段內存在異常請求的用戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海微盟企業發展有限公司,未經上海微盟企業發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111277187.6/2.html,轉載請聲明來源鉆瓜專利網。





