[發明專利]基于差分隱私的決策樹建模方法、預測方法、設備及介質有效
| 申請號: | 202111085147.1 | 申請日: | 2021-09-16 |
| 公開(公告)號: | CN113705727B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 謝世茂;王耀樂;李開宇 | 申請(專利權)人: | 四川新網銀行股份有限公司 |
| 主分類號: | G06F18/2431 | 分類號: | G06F18/2431;G06F18/214;G06F21/62;G06F21/60;G06N20/20 |
| 代理公司: | 成都行之專利代理事務所(普通合伙) 51220 | 代理人: | 梁田 |
| 地址: | 610000 四川省成都市中國(四川)自由*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隱私 決策樹 建模 方法 預測 設備 介質 | ||
1.基于差分隱私的決策樹建模方法,其特征在于,該決策樹建模方法應用于進行聯邦學習和差分隱私的第一設備,第一設備采用聯邦學習和差分隱私與第二設備進行交互,所述第一設備作為主動方,第二設備作為被動方;該決策樹建模方法包括:
S1:主動方對每個建模特征數據進行初始化,給出初始隨機預測值計算每個建模特征數據的一階導數gi和二階導數hi,及生成一個隨機浮點數Δrate;將各個建模特征數據的一階導數gi和二階導數hi均乘以隨機浮點數Δrate后發送給被動方,即主動方發送giΔrate和hiΔrate到被動方;
S2:被動方根據分箱數對各個建模特征數據進行等頻分箱,并對每個箱當中的giΔrate以及hiΔrate進行求和,并將所有建模特征數據的各個分箱的一階導數和、二階導數和返回給主動方;
S3:主動方根據隨機浮點數Δrate還原真實的導數和,計算每個可能的分位點增益,并記錄最大增益所在的特征數據編號以及分裂點信息,進行一層分裂;
S4:主動方反復執行步驟S2~S3,直至滿足停止條件,構建得到建模決策樹。
2.根據權利要求1所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S1中一階導數二階導數為初始隨機預測值,yi為樣本數據的真實標簽值。
3.根據權利要求1所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S1中生成一個隨機浮點數Δrate,其中Δrate的取值為0到1之間的一個隨機浮點數。
4.根據權利要求1所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S2包括以下子步驟:
被動方根據分箱數對各個建模特征數據進行等頻分箱;
被動方對每個箱當中的giΔrate以及hiΔrate進行求和,得到一階導數和gbint=∑i∈tgiΔrate,二階導數和hbint=∑i∈thiΔrate,其中,giΔrate以及hiΔrate是在步驟S1中由主動方發送過來的;i表示第i分箱,i的取值范圍為1~t;
被動方將所有建模特征數據的各個分箱的一階導數和gbint、二階導數和hbint返回給主動方。
5.根據權利要求4所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S3中的主動方根據隨機浮點數Δrate還原真實的導數和,包括真實一階導數和Gt、真實二階導數和Ht,計算公式為:和
6.根據權利要求4所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S3中的計算每個可能的分位點增益,增益gain的計算公式為:
其中:代表t分位點之前所有的一階導數和;代表t分位點之后的所有一階導數和;代表t分位點之前所有的二階導數和;代表t分位點之后所有的二階導數和;λ和γ為正則化系數。
7.根據權利要求1所述的基于差分隱私的決策樹建模方法,其特征在于,步驟S4中的停止條件為:所有的分裂點都沒有帶來增益時或者分裂達到預設層數時。
8.基于差分隱私的決策樹預測方法,其特征在于,該決策樹預測方法包括:
獲取待測樣本,并將所述待測樣本輸入至決策樹分類模型中,以通過所述決策樹分類模型獲得待測樣本的預測分類結果,并輸出;其中,
所述決策樹分類模型采用如權利要求1至7中任一所述的基于差分隱私的決策樹建模方法構建得到的決策樹分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川新網銀行股份有限公司,未經四川新網銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111085147.1/1.html,轉載請聲明來源鉆瓜專利網。





