[發明專利]訪問數據的驗證方法、裝置、設備及存儲介質有效
| 申請號: | 202110445229.6 | 申請日: | 2021-04-25 |
| 公開(公告)號: | CN112861093B | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 王軍;張毅駿;譚翔 | 申請(專利權)人: | 上海派拉軟件股份有限公司 |
| 主分類號: | G06F21/31 | 分類號: | G06F21/31;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 200120 上海市浦東新區中國(上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訪問 數據 驗證 方法 裝置 設備 存儲 介質 | ||
1.一種訪問數據的驗證方法,其特征在于,包括:
對于初始決策數模型中每個待分叉節點,根據訪問數據樣本確定所述待分叉節點的信息熵;基于所述信息熵對所述待分叉節點進行分叉,直到分叉至葉子節點,獲得初始決策樹模型;其中,所述訪問數據包括多維度的訪問信息及風險標簽;訪問信息包括登錄賬號、登錄時間、登錄地點及登錄設備型號;
根據所述訪問數據樣本對所述初始決策樹模型進行剪枝處理,獲得目標決策樹模型;
將待驗證訪問數據輸入所述目標決策樹模型,獲得所述待驗證訪問數據的風險類別;
根據設定規則對所述風險類別和所述待驗證訪問數據進行驗證,獲得驗證結果;
其中,根據所述訪問數據樣本對所述初始決策樹模型進行剪枝處理,獲得目標決策樹模型,包括:
分別計算各葉子節點的錯誤率及訪問概率;其中,所述錯誤率由葉子節點包含的訪問數據樣本為各風險標簽的概率確定,所述訪問概率為葉子節點包含的訪問數據樣本數量占總訪問數據樣本數量的比例;
根據各葉子節點的錯誤率及訪問概率計算所述初始決策樹模型的損失函數值;
根據所述損失函數值對所述初始決策樹模型進行剪枝處理,獲得目標決策樹模型。
2.根據權利要求1所述的方法,其特征在于,確定所述待分叉節點的信息熵,包括:
確定所述待分叉節點包含的訪問數據樣本中各維度的訪問信息分別對應的信息熵;
將信息熵最小的維度確定為目標維度;
相應的,基于所述信息熵對所述待分叉節點進行分叉,包括:
以所述目標維度為基準對所述待分叉節點進行分叉。
3.根據權利要求2所述的方法,其特征在于,確定所述待分叉節點包含的訪問數據樣本中各維度的訪問信息分別對應的信息熵,包括:
對于每個維度,確定所述維度包含的子維度;
計算各子維度的信息熵,并將各子維度的信息熵求和,獲得所述維度對應的信息熵。
4.根據權利要求3所述的方法,其特征在于,以所述目標維度為基準對所述待分叉節點進行分叉,包括:
對所述子維度進行排列組合,獲得多組分叉方式;
計算各組分叉方式的信息熵,并將信息熵最低的分叉方式確定為目標分叉方式;
根據所述目標分叉方式對所述待分叉節點進行分叉。
5.根據權利要求1所述的方法,其特征在于,根據所述損失函數值對所述初始決策樹模型進行剪枝處理,獲得目標決策樹模型,包括:
將所述損失函數值與設定閾值進行比較;
若所述損失函數值大于設定閾值,則將訪問概率最小的葉子節點剪掉,并更新所述初始決策樹模型;
返回執行分別計算各葉子節點的錯誤率及訪問概率的操作,直到所述損失函數至小于所述設定閾值,獲得目標決策樹模型。
6.一種訪問數據的驗證裝置,其特征在于,包括:
初始決策樹模型創建模塊,用于基于訪問數據樣本創建初始決策樹模型;其中,訪問數據包括多維度的訪問信息及風險標簽;訪問信息包括登錄賬號、登錄時間、登錄地點及登錄設備型號;
目標決策樹獲取模塊,用于根據所述訪問數據樣本對所述初始決策樹模型進行剪枝處理,獲得目標決策樹模型;
風險類別獲取模塊,用于將待驗證訪問數據輸入所述目標決策樹模型,獲得所述待驗證訪問數據的風險類別;
驗證結果確定模塊,用于根據設定規則對所述風險類別和所述待驗證訪問數據進行驗證,獲得驗證結果;
其中,所述初始決策樹模型創建模塊,還用于:
對于初始決策數模型中每個待分叉節點,根據訪問數據樣本確定待分叉節點的信息熵;基于信息熵對待分叉節點進行分叉,直到分叉至葉子節點,獲得初始決策樹模型;
其中,目標決策樹獲取模塊,還用于:
分別計算各葉子節點的錯誤率及訪問概率;其中,錯誤率由葉子節點包含的訪問數據樣本為各風險標簽的概率確定,訪問概率為葉子節點包含的訪問數據樣本數量占總訪問數據樣本數量的比例;
根據各葉子節點的錯誤率及訪問概率計算初始決策樹模型的損失函數值;
根據損失函數值對初始決策樹模型進行剪枝處理,獲得目標決策樹模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海派拉軟件股份有限公司,未經上海派拉軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110445229.6/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





