[發明專利]基于無監督學習的詐騙呼叫序列檢測方法有效
| 申請號: | 201910344174.2 | 申請日: | 2019-04-26 |
| 公開(公告)號: | CN110059889B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 萬辛;劉冠男;林浩;張亮;吳俊杰;安茂波;李鵬;沈亮;高圣翔 | 申請(專利權)人: | 國家計算機網絡與信息安全管理中心 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q50/32;G06F16/25;G06N3/08 |
| 代理公司: | 北京遠大卓悅知識產權代理有限公司 11369 | 代理人: | 史霞 |
| 地址: | 100029*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 學習 詐騙 呼叫 序列 檢測 方法 | ||
本發明提供了基于無監督學習的詐騙呼叫序列檢測方法,包括:構造主叫呼叫序列和呼叫二部圖;在呼叫二部圖中進行隨機游走過程,推斷各主叫號碼對應節點的低維嵌入表示向量;獲取各被叫號碼的唯一標識,以主叫號碼對應節點的低維嵌入表示向量以及第M個被叫號碼對應的唯一標識為神經網絡的輸入,以第M+1個被叫號碼對應的唯一標識為輸出,訓練獲得神經網絡預測模型;獲取待檢測主叫呼叫序列中主叫號碼對應節點的低維嵌入表示向量以及各被叫號碼對應的唯一標識,并輸入所述神經網絡預測模型,若得到的預測唯一標識與實際唯一標識的誤差大于設定閾值,則判斷主叫號碼為詐騙號碼。本發明中提出的方法容易實現并行化計算,可以實現較高的檢測效率。
技術領域
本發明屬于數據挖掘與機器學習和商務智能等領域,本發明具體涉及一種無監督學習的詐騙呼叫序列檢測方法,。
背景技術
電信欺詐檢測是目前國內外電信行業中一個重要的問題,它威脅到人們的財產安全,同時對電信正常運營帶來巨大的困擾。因此,運營商、政府部門都試圖采取各種手段和技術進行電信欺詐的檢測和識別。在實際中,每天呼叫的數據量非常大,涉及的被叫用戶達到了億級以上。而且,傳統依靠用戶標記進行詐騙電話的判斷需要大量用戶標記數據或網絡舉報投訴數據,上述數據的獲得存在較高的難度,因此在現實環境中往往缺乏有效的主叫號碼風險標簽。因此,亟需設計一種能夠一定程度克服上述缺陷的詐騙呼叫序列檢測方法。
發明內容
有鑒于欺詐主叫用戶一般會掩飾自己的行為在大量的正常行為中,并在較短的時間內隱藏他們的真實意圖,而且欺詐行為通常是在連續的時間中發生,以獲取非法利益,因此通過考慮主叫節點的完整行為序列為檢測欺詐行為提供了獨特的線索。本發明提供了一種基于無監督學習的詐騙呼叫序列檢測方法,構建主叫呼叫序列,同時構造主叫節點和被叫節點的有向序列二部圖;利用受限隨機游走和Skip-Gram方法學習主叫節點的低維嵌入表示向量;利用LSTM模型進行預測下一個目標節點;利用平均交叉熵構建損失函數并利用Adam進行優化并求解參數,能夠更準確地進行主叫的異常檢測。本發明便于處理大量呼叫數據,并無需使用用戶標記或投訴數據。
本發明提供了基于無監督學習的詐騙呼叫序列檢測方法,具體包括:
從基礎電信企業的信令數據庫中抽取主叫號碼的通話記錄,構造主叫呼叫序列,根據呼叫關系構造呼叫二部圖;
以呼叫二部圖中隨機一個主叫號碼為起點,在呼叫二部圖中進行隨機游走過程,基于隨機游走過程得到的節點集合,推斷各主叫號碼對應節點的低維嵌入表示向量;
獲取各被叫號碼的唯一標識,以主叫號碼對應節點的低維嵌入表示向量以及第M個被叫號碼對應的唯一標識為神經網絡的輸入,以第M+1個被叫號碼對應的唯一標識為輸出,訓練獲得神經網絡預測模型;
獲取待檢測主叫呼叫序列中主叫號碼對應節點的低維嵌入表示向量以及各被叫號碼對應的唯一標識,并輸入所述神經網絡預測模型,若得到的預測唯一標識與實際唯一標識的誤差大于設定閾值,則判斷主叫號碼為詐騙號碼。
優選的是,所述的基于無監督學習的詐騙呼叫序列檢測方法,所述主叫呼叫序列中被叫號碼的數量不小于設定閾值。
優選的是,所述的基于無監督學習的詐騙呼叫序列檢測方法,在隨機游走過程中,在到達一目標節點后,查看當前目標節點與上一目標節點之間的通話時長,若通話時長大于預設時間窗口,則隨機游走過程結束。
優選的是,所述的基于無監督學習的詐騙呼叫序列檢測方法,采用Skip-Gram方法推斷各主叫號碼對應節點的低維嵌入表示向量。
優選的是,所述的基于無監督學習的詐騙呼叫序列檢測方法,被叫號碼的唯一標識通過將被叫號碼轉化為獨熱編碼向量得到。
優選的是,所述的基于無監督學習的詐騙呼叫序列檢測方法,將低維嵌入表示向量和獨熱編碼向量連接,形成輸入向量輸入神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家計算機網絡與信息安全管理中心,未經國家計算機網絡與信息安全管理中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910344174.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:價格波動預測方法及裝置
- 下一篇:縣域尺度農業洪澇監測方法及系統
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





