[發明專利]一種基于大數據和機器學習的電信詐騙上當人發現方法在審
| 申請號: | 201811353163.2 | 申請日: | 2018-11-14 |
| 公開(公告)號: | CN109447180A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 高勇;孫志猛;劉善武;李進;孟繁瑞;趙龍斌;蔣維;郝振江;夏光升 | 申請(專利權)人: | 山東省通信管理局;國家計算機網絡與信息安全管理中心山東分中心;天津市國瑞數碼安全系統股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/00;H04M3/22 |
| 代理公司: | 北京力量專利代理事務所(特殊普通合伙) 11504 | 代理人: | 王鴻遠 |
| 地址: | 250000 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 被叫 分類器模型 預處理數據 分析對象 機器學習 訓練樣本 詐騙電話 轉換數據 大數據 電信 預警 安全技術領域 場景 電話記錄 通訊信息 原始電話 單數據 多維度 特征表 存儲 分析 篩選 發現 轉換 記錄 | ||
1.一種基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,包括以下步驟:
獲取原始電話記錄單,篩選出其中的詐騙電話事件;
分析詐騙電話事件中被叫的特征和場景以得到多維度特征表,并作為預處理數據進行存儲;
對預處理數據進行清理,得到待轉換數據;
將待轉換數據轉換成訓練樣本;
利用訓練樣本生成分類器模型;
將被叫為分析對象的電話記錄單數據代入分類器模型,進行預警。
2.根據權利要求1所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,采用填寫空缺值或者光滑噪聲數據或者識別刪除離群點或者刪除重復值或者數據降維中的至少一種方法對預處理數據進行清理。
3.根據權利要求2所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,采用建立數據倉庫,并通過平滑聚集或者數據概化或者數據規范化中的至少一種方法將待轉換數據轉換成訓練樣本。
4.根據權利要求3所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,利用訓練樣本生成分類器模型的步驟具體包括以下步驟:
預設數值m,m被用來決定當在一個節點上做決定時,會使用到多少個變量;
從N個訓練樣本中以可重復取樣的方式,取樣N次,形成一組訓練集;
對于每一個節點,隨機選擇m個基于此點上的變量,根據這m個變量,計算其最佳的分割方式,以得到分類器模型;
其中,m為小于變量數目的預設數值,N為訓練樣本的個數。
5.根據權利要求4所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,利用訓練樣本生成分類器模型的方式為:在訓練樣本上執行分類器算法,生成分類器模型。
6.根據權利要求5所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,分類器算法為決策樹算法。
7.根據權利要求6所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,分析詐騙電話事件中被叫的特征和場景的方式為記錄被叫在預設時間段內的行為特征和行為場景以得到多維度特征表。
8.根據權利要求7所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,對預處理數據進行清理之前還包括步驟:對多維度特征表采用隨機森林算法進行無監督學習聚類和異常點檢測,得到預處理數據。
9.根據權利要求8所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,將被叫為分析對象的電話記錄單數據代入分類器模型,進行預警的步驟具體包括以下步驟:
將被叫為分析對象的電話記錄單數據代入分類器模型,得到潛在上當人信息;
通過人工監聽驗證分類器模型,并進行預警。
10.根據權利要求9所述的基于大數據和機器學習的電信詐騙上當人發現方法,其特征在于,進行預警之前還包括步驟:
通過人工監聽驗證分類器模型,得到完善后的分類器模型;
將潛在上當人的電話記錄單數據代入完善后的分類器模型,并進行預警。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省通信管理局;國家計算機網絡與信息安全管理中心山東分中心;天津市國瑞數碼安全系統股份有限公司,未經山東省通信管理局;國家計算機網絡與信息安全管理中心山東分中心;天津市國瑞數碼安全系統股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811353163.2/1.html,轉載請聲明來源鉆瓜專利網。





