[發明專利]一種異常數據報文檢測方法、裝置及電子設備在審
| 申請號: | 202010069123.6 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111277465A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 周翱;陶睿;程寧;廖東;侯建強;何楚 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | H04L12/26 | 分類號: | H04L12/26;H04L12/24;G06F16/2458;G06Q40/04 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 許振新 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 數據 報文 檢測 方法 裝置 電子設備 | ||
1.一種異常數據報文檢測方法,包括:
生成待上報的目標數據報文;
基于所述目標數據報文與至少一條預設關聯關系的匹配關系,確定所述目標數據報文的風險總值,其中,所述至少一條預設關聯關系是基于預設關聯關系挖掘算法從批量歷史數據報文中挖掘出的,所述歷史數據報文為未出現異常的白樣本;
基于所述風險總值,確定所述目標數據報文是否存在異常風險。
2.根據權利要求1所述的方法,在所述基于所述目標數據報文與至少一條預設關聯關系的匹配關系,確定所述目標數據報文的風險總值之前,所述方法還包括:
基于預設關聯關系挖掘算法,從批量歷史數據報文中挖掘出所述至少一條預設關聯關系。
3.根據權利要求2所述的方法,其中,所述基于預設關聯關系挖掘算法,從批量歷史數據報文中挖掘出所述至少一條預設關聯關系,包括:
獲取所述批量歷史數據報文;
基于所述批量歷史數據報文進行特征工程,確定初始特征集;
刪除所述初始特征集中支持度小于第一閾值的特征,得到訓練特征集;
基于所述預設關聯關系挖掘算法,從所述訓練特征集中挖掘出置信度滿足預設條件的至少一條特征關聯關系作為所述至少一條預設關聯關系。
4.根據權利要求3所述的方法,其中,所述基于所述批量歷史數據報文進行特征工程,確定所述初始特征集,包括:
對所述批量歷史數據報文中的連續特征進行分箱處理,得到離散特征;
對得到的離散特征進行獨熱one-hot化處理,得到初始特征集。
5.根據權利要求4所述的方法,其中,所述刪除所述初始特征集中支持度小于預設閾值的特征,得到訓練特征集,包括:
從所述初始特征集中篩選出頻繁項為1的特征,得到頻繁特征集;
刪除所述頻繁特征集中支持度小于第一閾值的特征,得到訓練特征集。
6.根據權利要求1-5任一項所述的方法,
所述預設關聯關系算法包括頻繁模式FP-增長法和Apriori法中的一種。
7.根據權利要求1-5任一項所述的方法,其中,所述基于所述目標數據報文與至少一條預設關聯關系的匹配關系,確定所述目標數據報文的風險總值,包括:
確定所述目標數據報文與至少一條預設關聯關系的匹配關系;
當所述目標數據報文與所述預設關聯關系匹配時,將所述目標數據報文相對于所述預設關聯關系的風險值設為零;
當所述目標數據報文與所述預設關聯關系不匹配時,基于所述目標數據報文中指定特征的值與所述預設關聯關系中指定特征的值的距離,確定所述目標數據報文相對于所述預設關聯關系的風險值;
對所述目標數據報文相對于所述至少一條預設關聯關系的風險值進行匯總,得到所述目標數據報文的風險總值。
8.根據權利要求7所述的方法,其中,所述基于所述風險總值,確定所述目標數據報文是否存在異常風險,包括:
當所述風險總值為零時,確定所述目標數據報文不存在異常風險;
當所述風險總值大于零且小于第二閾值時,確定所述目標數據報文存在低異常風險;
當所述風險總值大于第二閾值時,確定所述目標數據報文存在高異常風險。
9.根據權利要求1-5、7-8中任一項所述的方法,在所述生成待上報的目標數據報文之前,所述方法包括:
生成待上報的特征數據;
基于第一預設規則,檢測所述特征數據中的單個特征是否存在異常,其中,所述第一預設規則是針對單一特征的格式錯誤校驗規則;
在所述特征數據中的單個特征不存在異常的情況下,基于所述特征數據生成待上報的目標數據報文。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010069123.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





