[發明專利]欺詐概率分析方法、裝置、電子設備及存儲介質在審
| 申請號: | 202011244453.0 | 申請日: | 2020-11-10 |
| 公開(公告)號: | CN114549164A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 汪海濤 | 申請(專利權)人: | 中移(上海)信息通信科技有限公司;中移智行網絡科技有限公司;中國移動通信集團有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06Q50/00;G06F16/215;G06F16/9536;G06N20/00 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 201260 上海市浦東新區中國(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 欺詐 概率 分析 方法 裝置 電子設備 存儲 介質 | ||
1.一種欺詐概率分析方法,其特征在于,包括:
獲取用戶信息數據并進行清洗處理,得到去噪數據集;
將所述去噪數據集輸入訓練好的機器學習模型,得到所述用戶所屬的社區;
根據所述用戶所屬的社區計算所述用戶屬于欺詐用戶的概率。
2.根據權利要求1所述的方法,其特征在于,所述獲取用戶信息數據并進行清洗處理,得到去噪數據集,包括:
獲取用戶信息數據;
刪除所述用戶信息數據中錯誤信息,并對缺失數據進行填補,得到去噪數據集。
3.根據權利要求1所述的方法,其特征在于,所述用戶信息數據包括:用戶通信行為數據、APP使用情況數據和短信網關數據。
4.根據權利要求1-3任一項所述的方法,其特征在于,所述訓練好的機器學習模型是通過下述步驟建立的:
獲取模型構建信息數據進行清洗處理,得到模型構建去噪數據集;
確定所述模型構建去噪數據集的特征信息,得到帶有關系網絡的數據集;
利用所述帶有關系網絡的數據集對機器學習模型進行訓練和測試,得到訓練好的機器學習模型。
5.根據權利要求4所述的方法,其特征在于,所述確定所述模型構建去噪數據集的特征信息,得到帶有關系網絡的數據集,包括:
確定所述模型構建去噪數據集中每個用戶與其他用戶的關系強弱;
基于每個用戶與其他用戶的關系強弱,利用鄰域相似假設確定所述正常無缺失數據集中每個用戶的關系網絡,得到帶有關系網絡的數據集。
6.根據權利要求5所述的方法,其特征在于,所述確定所述模型構建去噪數據集中每個用戶與其他用戶的關系強弱,包括:
利用網頁排名算法的數量假設與質量假設對所述模型構建去噪數據集中每個用戶與其他用戶的關系進行排名,得到所述正常無缺失數據集中每個用戶與其他用戶的關系強弱。
7.根據權利要求4所述的方法,其特征在于,所述訓練好的機器學習模型為:
其中,Σin為社區c內的邊的權重之和;Σkn為所有用戶與社區c內節點相連的邊的權重之和,因為i屬于社區c,其包括社區內節點與節點i的邊和社區外節點與節點i的邊;為所有用戶與社區c內節點相連的邊的權重之和,因為j屬于社區c,其包括社區內節點與節點j的邊和社區外節點與節點j的邊;Σtot為代替和是社區c內邊權重和加社區c與其他社區連邊的權重之和。
8.一種欺詐概率分析裝置,其特征在于,包括:
獲取去噪模塊,用于獲取用戶信息數據并進行清洗處理,得到去噪數據集;
所屬社區分析模塊,用于將所述去噪數據集輸入訓練好的機器學習模型,得到所述用戶所屬的社區;
欺詐概率計算模塊,用于根據所述用戶所屬的社區計算所述用戶屬于欺詐用戶的概率。
9.一種電子設備,其特征在于,包括:
處理器;
用于存儲所述處理器可執行指令的存儲器;
其中,所述處理器被配置為執行所述指令,以實現如權利要求1-7中任一項所述的欺詐概率分析方法。
10.一種存儲介質,其特征在于,當所述存儲介質中的指令由信息處理裝置或者服務器的處理器執行時,以使所述信息處理裝置或者所述服務器實現如權利要求1-7中任一項所述的欺詐概率分析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中移(上海)信息通信科技有限公司;中移智行網絡科技有限公司;中國移動通信集團有限公司,未經中移(上海)信息通信科技有限公司;中移智行網絡科技有限公司;中國移動通信集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011244453.0/1.html,轉載請聲明來源鉆瓜專利網。





