[發明專利]一種詐騙電話號碼的分析方法在審
| 申請號: | 201710028237.4 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN107506776A | 公開(公告)日: | 2017-12-22 |
| 發明(設計)人: | 王龑;夏致昊;張俊豐;榮軍;孔文峰;何文杰;龐韶敏;金紅;楊滿智;劉長永 | 申請(專利權)人: | 恒安嘉新(北京)科技股份公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F17/30;H04M1/663;H04M1/665 |
| 代理公司: | 北京萬慧達知識產權代理有限公司11111 | 代理人: | 黃玉東,王榮 |
| 地址: | 100191 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 詐騙 電話號碼 分析 方法 | ||
1.一種詐騙電話號碼的分析方法,其特征在于,所述方法包括:
步驟S1,特征分析和提取;根據相關詐騙案例經驗分析詐騙電話的原始話單信息,分析詐騙電話事件中的行為特征和行為場景,選取后續需要的特征并從原始話單中采集所需的特征數據集;
步驟S2,疑似類型篩選;根據不同行為場景對需要分析的現網全量話單進行篩選,得出疑似詐騙電話號碼及其疑似類型,并在之后根據不同的疑似類型采用具有針對性的分析模型進行分析;
步驟S3,詐騙電話號碼分類模型的訓練;根據已知的正常號碼、詐騙電話通話記錄樣本選取所需特征數據集,利用隨機森林算法訓練詐騙電話號碼分類模型;
步驟S4,現網數據的檢測和反饋;使用經過訓練得到的詐騙電話號碼分類模型,對經過篩選后的疑似詐騙電話號碼進行檢測,通過檢測識別出其中的詐騙電話號碼及正常電話號碼,保存并輸出上述各個分類的電話號碼的信息。
2.如權利要求1所述的詐騙電話號碼的分析方法,其特征在于,所述行為場景為詐騙者對受騙者行騙的手段,該手段包括仿冒公檢法的行為場景、仿冒銀行的行為場景、仿冒電商客服的行為場景。
3.如權利要求2所述的詐騙電話號碼的分析方法,其特征在于,在步驟S2中,所述疑似類型包括仿冒公檢法、仿冒銀行、仿冒電商客服,篩選方式為根據不同行為場景,只采集與其對應場景相關的話單記錄。
4.如權利要求1所述的詐騙電話號碼的分析方法,其特征在于,在步驟S3中,還包括:通過新的數據訓練樣本對詐騙電話號碼分類模型進行反復離線訓練,不斷修正分類模型的判斷依據。
5.如權利要求4所述的詐騙電話號碼的分析方法,其特征在于,在步驟S4中,還包括:對檢測識別出的上述各個分類的電話號碼的信息進行核對修正后作為新的訓練樣本補充進原訓練樣本中對詐騙電話號碼分類模型進行訓練。
6.如權利要求1所述的詐騙電話號碼的分析方法,其特征在于,在步驟S1中,所述用于詐騙電話號碼分析的特征數據集是根據大量已知的詐騙電話號碼的話單數據,抽象出它們共同的行為特征形成的。
7.如權利要求6所述的詐騙電話號碼的分析方法,其特征在于,所述行為特征包括號碼所在地、通話時長、與手機通話次數與總通話次數占比、是否與仿冒號碼通話、主要呼叫地區、呼叫中陌生號碼占比等。
8.如權利要求6所述的詐騙電話號碼的分析方法,其特征在于,通過隨機森林分類模型對詐騙電話號碼進行模型訓練和識別的方法具體包括:
訓練過程:獲得正常號碼的通話記錄話單,并按號碼提取所屬的特征數據集,并添加標簽;獲得詐騙號碼的通話記錄話單,并按號碼提取所屬的特征數據集,并添加標簽;將上述已經標記好的訓練數據集導入隨機森林模型當中進行訓練,得到經訓練的隨機森林分類模型;
識別過程:將待檢測號碼的通話記錄話單按號碼提取所屬的特征數據集,將其輸入上述經訓練的隨機森林分類模型當中;隨機森林分類模型將根據每個號碼的數據特征,反饋它的分類結果標簽是正常號碼或是詐騙號碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于恒安嘉新(北京)科技股份公司,未經恒安嘉新(北京)科技股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710028237.4/1.html,轉載請聲明來源鉆瓜專利網。





