[發明專利]一種基于時間序列聚類檢測異常風險賬戶的方法在審
| 申請號: | 202011389228.6 | 申請日: | 2020-12-01 |
| 公開(公告)號: | CN112381546A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 施炎;徐德華;徐華建;余杰潮;湯敏偉;李真 | 申請(專利權)人: | 天翼電子商務有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 102200 北京市昌平*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時間 序列 檢測 異常 風險 賬戶 方法 | ||
1.一種基于時間序列聚類檢測異常風險賬戶的方法,其特征在于,包括以下步驟:
步驟1,數據獲取:獲取待研究區域的用戶交易數據,用戶操作數據,用戶基本屬性數據,其中用戶交易數據和操作數據包含每個操作和交易的詳細名稱和時間,用戶基本屬性數據包含用戶唯一標識,是否中黑名單,地理位置相關信息等;
步驟2,數據預處理:將步驟1所獲取的數據,按照用戶先進行分組,在每個用戶的組內按照操作和交易發生的時間順序進行排序;
步驟3,生成時間序列:將步驟2處理好的數據,將每個用戶的操作名稱和交易名稱按照時間順序排列形成第一操作-交易名稱序列;將每個用戶操作名稱和交易時間點按照時間順序排列形成第二操作-交易時間點序列;將每個用戶操作名稱和交易時間點按照時間順序后一個時間點減去前一個時間點形成第三操作-交易時間間隔序列;
步驟4,時間序列數值化:對于第一操作-交易名稱序列,首先使用seq2seq方法對名稱序列建模,然后利用該模型對該序列的每個名稱進行向量化,最后將該序列中所有名稱向量化后的結果相加求平均值;對于第二操作-交易時間點序列,將該序列的每個時間點減去一個固定的時間節點(如2020年01月01日)計算結果根據需要保存為天,時,分或者秒;對于第三操作-交易時間間隔序列,根據需求直接換算成天,時,分或者秒;
步驟5,時間序列聚類分組:以步驟4第一操作-交易名稱序列的向量做為輸入值,使用MeanShift聚類算法進行聚類分組,將在時間上具有相似操作和交易的用戶分到相同的組中并給每個組編號;
步驟6,時間序列組內指標計算:計算每個組內用戶的黑樣本占比,平均操作交易時間,平均序列長度等業務指標,把超過業務指標的認定為異常風險賬戶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天翼電子商務有限公司,未經天翼電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011389228.6/1.html,轉載請聲明來源鉆瓜專利網。





