[發明專利]基于聯邦學習的GBDT與LR融合方法、裝置、設備和存儲介質在審
| 申請號: | 202011182203.9 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112288101A | 公開(公告)日: | 2021-01-29 |
| 發明(設計)人: | 王健宗;肖京;何安珣 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20;G06Q40/00;G06F21/60 |
| 代理公司: | 深圳市明日今典知識產權代理事務所(普通合伙) 44343 | 代理人: | 王杰輝;宋慶洪 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 聯邦 學習 gbdt lr 融合 方法 裝置 設備 存儲 介質 | ||
1.一種基于聯邦學習的GBDT與LR融合方法,應用于主動方,其特征在于,包括以下步驟:
計算各個第一樣本的梯度,將所述梯度經過加密后傳給被動方,其中,所述第一樣本具有標簽;
獲取被動方經過加密后的梯度和組;其中,所述梯度和組是通過所述被動方將各個第二樣本按照屬性進行分組后,計算各個分組的梯度和所得到的梯度和組;所述第一樣本和所述第二樣本對應相同的用戶,所述第二樣本不具有標簽;
對所述梯度和組進行解密,根據解密后的所述梯度和選取最優特征劃分,將所述最優特征劃分對應的劃分值傳給所述被動方;
獲取所述被動方被劃分為左結點或右結點的樣本空間;其中,所述樣本空間是通過所述被動方將所述第二樣本根據所述劃分值進行劃分,所得到左結點或右結點對應的樣本空間;
根據所述樣本空間對所述第一樣本進行分裂,得到GBDT模型對應的樹結構;
根據所述樹結構構建特征矩陣,進行邏輯回歸的訓練,得到LR模型。
2.根據權利要求1所述的基于聯邦學習的GBDT與LR融合方法,其特征在于,所述對所述梯度和組進行解密,根據解密后的所述梯度和選取最優特征劃分,將所述最優特征劃分對應的劃分值傳給所述被動方的步驟,包括:
對所述梯度和組進行解密;
根據解密后的所述梯度和計算所述第一樣本的增益;
根據所述增益選取最優特征劃分;
將所述最優特征劃分所對應的劃分值傳遞給所述被動方。
3.根據權利要求2所述的基于聯邦學習的GBDT與LR融合方法,其特征在于,所述根據解密后的所述梯度和計算所述第一樣本的增益的步驟,包括:
通過公式計算所述第一樣本的增益,其中,所述gl、hl為分裂為左結點中第一樣本的梯度信息,所述gr、hr為分裂為右結點中第一樣本的梯度信息,所述g、h為當前所述第一樣本的梯度信息,所述λ為公式G的參數。
4.根據權利要求1所述的基于聯邦學習的GBDT與LR融合方法,其特征在于,所述根據所述樣本空間對所述第一樣本進行分裂,得到GBDT模型對應的樹結構的步驟,包括:
根據所述樣本空間,將所述樣本空間內的所述第二樣本相對應的所述第一樣本劃分為左結點;
將剩余所述第一樣本劃分為右結點,得到所述GBDT模型對應的樹結構。
5.根據權利要求1所述的基于聯邦學習的GBDT與LR融合方法,其特征在于,所述根據所述樹結構構建特征矩陣,進行邏輯回歸的訓練,得到LR模型的步驟,包括:
對所述樹結構中的葉子結點作one-hot編碼;
根據所述one-hot編碼對所述第一樣本進行賦值,構造稀疏矩陣;
將所述稀疏矩陣作為特征矩陣,進行邏輯回歸的訓練,得到所述LR模型。
6.一種基于聯邦學習的GBDT與LR融合方法,應用于被動方,其特征在于,包括以下步驟:
獲取所述被動方的各個第二樣本的年齡特征值;
對所述第二樣本根據所述年齡特征值進行排序;
對所述第二樣本根據所述排序按照預設分位數進行劃分,得到各個分組;
計算各個分組的梯度和,得到所述梯度和組;
將所述梯度和組經過加密后傳給主動方;
獲取所述主動方的劃分值;其中,所述劃分值是所述主動方對所述梯度和組進行解密,根據解密后的所述梯度和選取最優特征劃分所得到的;
將屬于所述劃分值的所述第二樣本劃分在左結點,將不屬于所述劃分值的所述第二樣本劃分在右結點,得到所述左結點或所述右結點對應的樣本空間;
將所述左結點或所述右結點對應的樣本空間傳遞給所述主動方。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011182203.9/1.html,轉載請聲明來源鉆瓜專利網。





