[發明專利]詐騙號碼識別及其模型訓練方法、相關設備及存儲介質有效
| 申請號: | 202210732055.6 | 申請日: | 2022-06-27 |
| 公開(公告)號: | CN114828013B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 王茸茸;孫悅;蔡準;郭曉鵬 | 申請(專利權)人: | 北京芯盾時代科技有限公司 |
| 主分類號: | H04W12/12 | 分類號: | H04W12/12;H04W12/128;G06K9/62;G06N20/00 |
| 代理公司: | 北京樂知新創知識產權代理事務所(普通合伙) 11734 | 代理人: | 胡春嬌 |
| 地址: | 102300 北京市門頭*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 詐騙 號碼 識別 及其 模型 訓練 方法 相關 設備 存儲 介質 | ||
1.一種詐騙號碼識別方法,其特征在于,所述方法包括:
獲取待識別號碼以及所述待識別號碼的通信相關數據;
將所述待識別號碼以及所述待識別號碼的通信相關數據輸入至識別模型的第一層,得到所述待識別號碼中的非正常類號碼;所述非正常類號碼包括服務類號碼和疑似詐騙類號碼;
將所述非正常類號碼及所述非正常類號碼的通信相關數據輸入至識別模型的第二層,得到所述待識別號碼中的疑似詐騙類號碼;
將所述疑似詐騙類號碼及所述疑似詐騙類號碼的通信相關數據輸入至識別模型的第三層,得到所述待識別號碼中的詐騙號碼以及所述詐騙號碼的詐騙類別;
其中,
輸入至所述第一層的待識別號碼和待識別號碼的通信相關數據在由所述第一層得出的待識別號碼的通信特征和正常類號碼的通信特征之間的差異值大于第一閾值時而得到所述待識別號碼中的非正常類號碼;
輸入至所述第二層的非正常類號碼和非正常類號碼的通信相關數據在由所述第二層得出的非正常類號碼的通信特征和服務類號碼的通信特征之間的差異值大于第二閾值時而得到所述非正常類號碼中的疑似詐騙類號碼;
所述第三層基于對疑似詐騙類號碼的通信相關數據進行分析而得到的疑似詐騙類號碼的通信特征而識別所述疑似詐騙類號碼為詐騙號碼;
所述方法還包括:
獲取第一類號碼樣本,所述第一類號碼樣本包括正常類電話號碼,采用第一類號碼樣本以及第一類號碼樣本的通信相關數據對識別模型的第一層進行訓練;對所述識別模型的第一層訓練在損失函數最小時完成訓練,其中,M為第一類號碼樣本的數量,M為大于1的正整數;表示第一類號碼樣本的通信特征,為基于自編碼器對第一類號碼樣本重構出的分布特征;
獲取第二類號碼樣本,所述第二類號碼樣本包括服務類電話號碼,采用第二類號碼樣本以及第二類號碼樣本的通信相關數據對識別模型的第二層進行訓練;對所述識別模型的第二層訓練在損失函數最小時完成訓練,其中,為第二類號碼樣本的數量,為大于1的正整數;表示第二類號碼樣本的通信特征,為基于自編碼器對第二類號碼樣本重構出的分布特征;
獲取第三類號碼樣本,所述第三類號碼樣本包括詐騙類電話號碼,采用第三類號碼樣本以及第三類號碼樣本的通信相關數據對識別模型的第三層進行訓練;對所述識別模型的第三層訓練在損失函數最小時完成訓練,其中,表示第三類號碼樣本的真實標簽值,表示基于Xgboost分類器對第三類號碼樣本預測出的樣本標簽值。
2.根據權利要求1所述的方法,其特征在于,所述詐騙類別為所述識別模型的第三層基于對所述詐騙號碼屬于至少兩個詐騙類別中的各詐騙類別的概率中的最大概率值而得到。
3.一種詐騙號碼識別模型的訓練方法,其特征在于,所述詐騙號碼識別模型包括第一層、第二層和第三層;
獲取第一類號碼樣本,所述第一類號碼樣本包括正常類電話號碼,采用第一類號碼樣本以及第一類號碼樣本的通信相關數據對識別模型的第一層進行訓練;對所述識別模型的第一層訓練在損失函數最小時完成訓練,其中,M為第一類號碼樣本的數量,M為大于1的正整數;表示第一類號碼樣本的通信特征,為基于自編碼器對第一類號碼樣本重構出的分布特征;
獲取第二類號碼樣本,所述第二類號碼樣本包括服務類電話號碼,采用第二類號碼樣本以及第二類號碼樣本的通信相關數據對識別模型的第二層進行訓練;對所述識別模型的第二層訓練在損失函數最小時完成訓練,其中,為第二類號碼樣本的數量,為大于1的正整數;表示第二類號碼樣本的通信特征, 為基于自編碼器對第二類號碼樣本重構出的分布特征;
獲取第三類號碼樣本,所述第三類號碼樣本包括詐騙類電話號碼,采用第三類號碼樣本以及第三類號碼樣本的通信相關數據對識別模型的第三層進行訓練;對所述識別模型的第三層訓練在損失函數最小時完成訓練,其中,表示第三類號碼樣本的真實標簽值,表示基于Xgboost分類器對第三類號碼樣本預測出的樣本標簽值;
其中,訓練完成的第一層用于基于待識別號碼以及待識別號碼的通信相關數據得到待識別號碼中的非正常類號碼;所述非正常類號碼包括服務類號碼和疑似詐騙類號碼;訓練完成的第二層用于基于非正常類號碼及所述非正常類號碼的通信相關數據得到待識別號碼中的疑似詐騙類號碼;訓練完成的第三層用于基于疑似詐騙類號碼及所述疑似詐騙類號碼的通信相關數據得到所述待識別號碼中的詐騙號碼以及所述詐騙號碼的詐騙類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京芯盾時代科技有限公司,未經北京芯盾時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210732055.6/1.html,轉載請聲明來源鉆瓜專利網。





