[發明專利]基于無監督學習的詐騙呼叫序列檢測方法有效
| 申請號: | 201910344174.2 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110059889B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 萬辛;劉冠男;林浩;張亮;吳俊杰;安茂波;李鵬;沈亮;高圣翔 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/32;G06F16/25;G06N3/08 |
| 代理公司: | 北京遠大卓悅知識產權代理有限公司 11369 | 代理人: | 史霞 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 學習 詐騙 呼叫 序列 檢測 方法 | ||
1.基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,包括:
從基礎電信企業的信令數據庫中抽取主叫號碼的通話記錄,構造主叫呼叫序列,根據呼叫關系構造呼叫二部圖,呼叫二部圖包括對應主叫號碼的主叫節點和對應被叫號碼的被叫節點;
以呼叫二部圖中隨機一個主叫號碼對應的主叫節點為起點,在呼叫二部圖中進行隨機游走過程,基于隨機游走過程得到的節點集合,采用Skip-Gram方法推斷各主叫號碼對應的主叫節點的低維嵌入表示向量;
獲取各被叫號碼的唯一標識,以主叫號碼對應的主叫節點的低維嵌入表示向量以及第M個被叫號碼對應的唯一標識為神經網絡的輸入,以第M+1個被叫號碼對應的唯一標識為輸出,訓練獲得神經網絡預測模型;
獲取待檢測主叫呼叫序列中主叫號碼對應的主叫節點的低維嵌入表示向量以及各被叫號碼對應的唯一標識,并輸入所述神經網絡預測模型,若得到的預測唯一標識與實際唯一標識的誤差大于設定閾值,則判斷主叫號碼為詐騙號碼。
2.如權利要求1所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,所述主叫呼叫序列中被叫號碼的數量不小于設定閾值。
3.如權利要求1所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,在隨機游走過程中,在到達一目標節點后,查看當前目標節點與上一目標節點之間的通話時長,若通話時長大于預設時間窗口,則隨機游走過程結束。
4.如權利要求1所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,被叫號碼的唯一標識通過將被叫號碼轉化為獨熱編碼向量得到。
5.如權利要求4所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,將低維嵌入表示向量和獨熱編碼向量連接,形成輸入向量輸入神經網絡。
6.如權利要求1所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,所述神經網絡為LSTM神經網絡。
7.如權利要求1所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,還包括:
在訓練神經網絡過程中選擇Lq為損失函數;
c′t為神經網絡輸出的唯一標識,ct為實際的唯一標識,T為主叫呼叫序列中第一個被叫號碼與最后一個被叫號碼之間的時間間隔,N是總的序列數量。
8.如權利要求1或7所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,采用Adam算法訓練神經網絡。
9.如權利要求7所述的基于無監督學習的詐騙呼叫序列檢測方法,其特征在于,計算預測唯一標識與實際唯一標識之間的損失函數數值,若損失函數數值大于設定閾值,則判斷主叫號碼為詐騙號碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344174.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:價格波動預測方法及裝置
- 下一篇:縣域尺度農業洪澇監測方法及系統
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





