[發明專利]一種基于機器學習的電信反欺詐方法在審
| 申請號: | 202210034458.3 | 申請日: | 2022-01-13 |
| 公開(公告)號: | CN114513791A | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 吳勇;顧強峰;梁曉龍;徐夢蝶;李炳;梁建斌;陳一蕾 | 申請(專利權)人: | 浙江鴻程計算機系統有限公司 |
| 主分類號: | H04W12/128 | 分類號: | H04W12/128;G06N20/00 |
| 代理公司: | 杭州之江專利事務所(普通合伙) 33216 | 代理人: | 張慧英 |
| 地址: | 310000 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 電信 欺詐 方法 | ||
本發明涉及一種基于機器學習的電信反欺詐方法,本發明旨在解決及時攔截電信詐騙的問題,目標是提前預警提前防范電信詐騙的情況,本發明利用機器學習中的LightGBM算法對正負樣本進行訓練和預測,并將常見的詐騙場景分為四大類,根據不同的大類分別進行建模訓練,提高預測的準確性。
技術領域
本發明涉及計算機大數據分析和機器學習技術領域,尤其涉及一種基于機器學習的電信反欺詐方法。
背景技術
近幾年,電信詐騙案件頻發,不法分子利用向被害人群發詐騙短信、撥打詐騙電話,實時詐騙,許多電信網絡詐騙犯罪案件呈有組織化發展。按工信部要求,應當建立預警監測、大數據研判等機制,防范未經用戶同意或者請求發送的商業性短信息或撥打的商業性電話,防范和打擊電信詐騙違法犯罪行為,維護人民群眾合法權益,保障國家安全和社會安定。除了強化防詐意識,提高識騙防騙能力以外,如何快速從源頭上遏制電信詐騙的發生,也是至關重要的一步。電信運營商如何通過各種技術手段,建立用戶行為涉詐騷擾預測機制,構建涉詐預警分析能力,達到防范和打擊電信詐騙目的,是目前存在的技術難題。如何防范電信電話詐騙,及時阻斷不法分子的通話行為,預測運營商號卡的涉詐風險等級情況也是至關重要的;傳統的反欺詐方法主要是利用經驗和人工的規則判斷針對低套餐和新入網用戶在產生高話務的同時進行攔截,但無法做到提前預警和防范;現有反電信詐騙模型大多是根據人工經驗或者規則判斷去攔截已經有發生通話的涉詐用戶,很難做到提前預警,且容易以偏概全,時長會有規則難以覆蓋的詐騙號碼產生。
發明內容
本發明為克服上述的不足之處,目的在于提供一種基于機器學習的電信反欺詐方法,本發明能夠準確有效識別別出高風險的涉詐用戶,分層分級對涉詐用戶進行預警、核驗和關停處置。
本發明是通過以下技術方案達到上述目的:一種基于機器學習的電信反欺詐方法,包括如下步驟:
(1)根據歷史所有的通報號碼和通報的內容分析梳理,不同場景梳理,將潛在電信詐騙用戶細分,深入挖掘用戶分群,刻畫出目標用戶的特征;
(2)進行數據采集,針對現有存量用戶采集其各個維度的特征,從用戶的基本屬性,通話行為數據,套餐入網信息,消費使用特征,終端標記信息,衍生變量這六大維度入手,細分成178個特征,構建號卡的活躍行為寬表,采集用戶數據;
(3)進行數據清洗和預處理,根據用戶寬表數據,對進行缺失值檢測和異常值檢查;
(4)進行數據采樣,采用加入偽標簽的方法,即已經被預測為涉詐用戶且沒有復機的號卡作為正樣本加入被通報的號卡,使得正負樣本的比例控制在1:15;
(5)基于機器學習算法訓練模型,預測用戶是電信詐騙用戶的概率,同時利用交叉驗證和網格搜索來尋找模型的最優參數;
(6)進行模型的迭代與優化;根據投訴用戶、復機用戶、接入用戶優化模型,實現達到更好的預測效果。
作為優選,所述步驟(1)的通報號碼分析具體為:根據公安和12321下發的通報號碼核查分析,從用戶的入網情況,套餐消費,歷史活躍行為,上網行為,通話指標及位置信息入手分析正常用戶與涉詐用戶存在的區別,刻畫出目標用戶的特征。
作為優選,所述步驟(3)的數據清洗和預處理具體為:數據中的用戶年齡,月出賬信息,用戶粘性采用中值填充,用戶出賬,省內外流量使用,語音通話次數、語音通話時長分別采用零值填充,針對異常值,用平均值來修正;針對數據中出現的數值,類型,日期等錯誤問題進行修正;針對缺失值,如年齡的缺失采用中位數填充,如月消費金額則進行零值的填充;在預處理中,針對一些類別變量,如用戶的終端型號,用戶的套餐名稱,則進行獨熱編碼的處理,將原本的中文類別轉為計算機可處理的數字信息。
作為優選,所述步驟(4)數據采樣時利用SMOTE算法,SMOTE算法是利用線性插值的方法計算兩個新近通報號碼樣本,生成新的人工正樣本加入到總體的正向樣本中擴充正樣本的數量;即運用公式:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江鴻程計算機系統有限公司,未經浙江鴻程計算機系統有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210034458.3/2.html,轉載請聲明來源鉆瓜專利網。





