[發明專利]一種基于email地址識別的偵測方法有效
| 申請號: | 201611201725.2 | 申請日: | 2016-12-22 |
| 公開(公告)號: | CN108234434B | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 唐亙;周輝;張克 | 申請(專利權)人: | 上海行邑信息科技有限公司 |
| 主分類號: | H04L29/06 | 分類號: | H04L29/06;H04L12/58 |
| 代理公司: | 上海唯源專利代理有限公司 31229 | 代理人: | 曾耀先 |
| 地址: | 200092 上海市楊浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 email 地址 識別 偵測 方法 | ||
1.一種基于email地址識別的偵測方法,其特征在于,包括:
從服務器端接收一email地址的郵件操作產生的數據包以獲取email參數集W;
基于所述參數集W選定多個元素以更新歷史記錄數據庫,所述多個元素至少包含本次郵件操作事件的類型、email地址參數及事件時間戳;
基于所述歷史記錄數據庫統計每一個元素的使用習慣向量以構成參數集W對應的使用習慣向量集L,所述使用習慣向量至少包括以下向量的至少一種:元素出現比例的第一分布向量及每個元素對應郵件操作事件時間頻率的第二分布向量;
針對所述使用習慣向量集L進行聚類分析,并根據聚類結果偵測異常email地址,
還包括:預先定義所述數據包;所述數據包包括:進行所述郵件操作的設備信息、網絡信息及賬戶信息。
2.如權利要求1所述的方法,其特征在于,所述郵件操作事件的類型包括:注冊新賬戶、登錄賬戶及郵件發送。
3.如權利要求1所述的方法,其特征在于,所述參數集W包括如下email地址參數:
email地址合法參數;
email所屬類型參數;
email所屬廠商參數;
email用戶名字符串的特殊字符判定參數;
email用戶名字符串的分割字符判定參數;
email用戶名字符串的數字判定參數;
email用戶名字符串的名字判定參數;
email用戶名被上述分割字符分割后的長度參數。
4.如權利要求1所述的方法,其特征在于,所述歷史記錄數據庫還記錄了對應時間維度上相同email地址參數類型賬戶數目的賦值比例。
5.如權利要求4所述的方法,其特征在于,所述基于所述參數集W選定多個元素以更新歷史記錄數據庫包括:
對所述時間戳依據設定的時間單位轉換至時間維度;
基于所設定的時間單位對歷史時間維度上的所述賦值比例分配權重;
對所述時間單位下的所述賦值比例進行加權相加以更新所述歷史記錄數據庫。
6.如權利要求5所述的方法,其特征在于,所述權重為J,則有:
Jn=an(a/(1-a)),其中,a為大于零且小于1的預定常數,n為時間單位的計數,n=1~N,1為最近一次更新的時間段,N為第一次更新的時間段。
7.如權利要求1所述的方法,其特征在于,所述針對所述使用習慣向量集L進行聚類分析包括:
設使用習慣向量集L為v,將所述參數集W中參數對應的使用習慣向量按預定分組方式進行分組,以得到組向量集合v1=(v11,…,v1r1)、v2=(v21,…,v2r2)、…、vm=(vm1,…,vmrm),1、2、…、m分別為分組數目,r1、r2、…、rm分別為各組向量集合的元素個數;
設定各組向量集合對應的權重w1~wm,并定義兩兩組向量集合之間距離為兩個組向量距離分別與各自對應權重之積的相加結果;
針對所述兩兩組向量集合之間距離使用K-means算法進行聚類,并使用Elbow method算法確定最佳聚類個數f以及f個聚類中心,記為{k1,k2,...kf};
計算每一個email地址參數的使用習慣向量到對應聚類中心的距離,并計算對應的分布分位數。
8.如權利要求7所述的方法,其特征在于,所述根據聚類結果偵測異常email地址包括:
設定選定分位數閾值;
若所述email地址參數的分布分位數與所述分位數閾值相較不符合選定要求,則將所述email地址參數輸入至異常email信息庫。
9.如權利要求1所述的方法,其特征在于,還包括:
若所述email地址參數為所述異常email地址,則依據所述聚類結果對所述email地址確定風險等級。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海行邑信息科技有限公司,未經上海行邑信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611201725.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于處理視頻業務的方法和裝置
- 下一篇:一種基于IP分類的自動檢測方法





