[發明專利]一種識別行為異常用戶的方法及裝置有效
| 申請號: | 201710209852.5 | 申請日: | 2017-03-31 |
| 公開(公告)號: | CN107133265B | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 王正平 | 申請(專利權)人: | 咪咕動漫有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06K9/62 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 蔣雅潔;張穎玲 |
| 地址: | 361008 福建省*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 行為 異常 用戶 方法 裝置 | ||
本發明公開了一種識別行為異常用戶的方法,包括:根據黑號碼庫和白號碼庫在全量話單的信令數據中獲取訓練信令數據和測試信令數據;獲取訓練信令數據中特征值與目標的特征值相關性較高的第一信令數據;根據第一信令數據的特征值和時間粒度生成包括衍生指標的第一信息表;使用第一篩選策略對衍生指標進行篩選,生成包括顯著指標的第二信息表;將第一信息表和第二信息表結合,生成訓練信息表;基于所述訓練信息表建立第一模型,并使用所述測試信令數據對所述第一模型進行測試,得到測試結果;根據所述測試結果對所述第一模型進行評估,得到評估優化后的第二模型,以識別行為異常用戶。本發明還公開了一種識別行為異常用戶的裝置。采用本發明提供的識別行為異常用戶的方法及裝置,可以減少算法模型上線后的調整優化時間。
技術領域
本發明涉及計算機技術領域,尤其涉及一種識別行為異常用戶的方法及裝置。
背景技術
現有技術中識別異常呼叫用戶或詐騙號碼時,一般先通過用戶自主標記、警方與信安部提供黑名單、第三方友商渠道等建立或搜集黑名單,對黑名單進行分類后建立數據庫,再將當前號碼與數據庫進行比對進行當前號碼識別。該方法不能有效實時發現行為異常的用戶或是涉及詐騙的號碼。
另一種識別異常呼叫用戶或詐騙號碼的方案中,通過算法針對用戶行為進行分析并形成算法模型,該方案能透過現有的數據測試算法模型是否正確,并在算法模型實際上線運作后逐步調整優化,但算法模型從上線到穩定運行所需時間較長,從而導致在較長時間內無法識別行為異常用戶。
發明內容
為解決上述技術問題,本發明實施例提供一種識別行為異常用戶的方法及裝置,以減少算法模型上線后的調整優化時間。
本發明實施例的技術方案是這樣實現的:
本發明實施例提供一種識別行為異常用戶的方法及裝置,包括:
根據黑號碼庫和白號碼庫在全量話單的信令數據中獲取訓練信令數據和測試信令數據;
獲取訓練信令數據中特征值與目標的特征值相關性較高的第一信令數據;
根據所述第一信令數據的特征值和時間粒度生成包括衍生指標的第一信息表;
使用第一篩選策略對所述衍生指標進行篩選,生成包括顯著指標的第二信息表;
將所述第一信息表和所述第二信息表結合,生成訓練信息表;
基于所述訓練信息表建立第一模型,并使用所述測試信令數據對所述第一模型進行測試,得到測試結果;
根據所述測試結果對所述第一模型進行評估,得到評估優化后的第二模型,以識別行為異常用戶。
上述方案中,所述根據黑號碼庫和白號碼庫在全量話單的信令數據中獲取訓練信令數據和測試信令數據,包括:
從數據庫中取出全量話單的信令數據;
根據黑號碼庫和白號碼庫,在全量話單中獲取黑樣本數據和白樣本數據;
通過黑樣本數據和白樣本數據在全量話單的信令數據中獲取訓練信令數據和測試信令數據。
上述方案中,所述獲取訓練信令數據中特征值與目標的特征值相關性較高的第一信令數據,包括:
將訓練信令數據中特征值與目標的特征值無關的信令數據或特征值為噪聲的信令數據刪除,獲取訓練信令數據中特征值與目標的特征值相關性較高的第一信令數據。
上述方案中,所述使用第一篩選策略對所述衍生指標進行篩選,包括:
對所述衍生指標的特征值兩兩之間的相關性進行相關分析,根據分析結果將多余特征值篩除;
對所述衍生指標的特征值與目標的特征值的相關性進行維規約分析,根據分析結果將不相關特征值篩除。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于咪咕動漫有限公司,未經咪咕動漫有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710209852.5/2.html,轉載請聲明來源鉆瓜專利網。





