[發明專利]一種兩方決策樹訓練方法和系統有效
| 申請號: | 202010723916.5 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111738360B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 方文靜;王力;周俊 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 成都七星天知識產權代理有限公司 51253 | 代理人: | 袁春曉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 決策樹 訓練 方法 系統 | ||
本說明書實施例公開了一種兩方決策樹訓練方法和系統,以保護雙方的數據隱私。對于任一特征,兩方的設備按照多方安全計算協議進行交互,以基于梯度向量的分片和任一分組對應的標識向量計算該特征下的該分組對應的梯度和的分片。兩方的設備按照多方安全計算協議進行交互,以基于各特征下的各分組分別對應的梯度和的分片計算各特征下的各分組分別對應的分裂增益的分片。進而,兩方的設備通過多方安全比較協議確定最大分裂增益對應的特征及分組,并按最大分裂增益對應的特征及分組分裂節點。
技術領域
本說明書涉及信息技術領域,特別涉及一種兩方決策樹訓練方法和系統。
背景技術
為了保護各方數據隱私,在機器學習領域會采用分布式訓練方案。即,在不泄露任一參與方持有的樣本數據的前提下,任一參與方可訓練屬于自己的模型。
目前,希望提供一種針對決策樹的分布式訓練方案。
發明內容
本說明書實施例之一提供一種兩方決策樹訓練方法,其中,所述方法由第一方的設備執行,所述第一方為持有樣本集中各樣本的至少一個特征的特征值及標簽值的一方和持有所述樣本集中各樣本的至少一個特征的特征值的一方中任一方,第二方為兩方中的另一方;所述方法包括:
按以下分裂步驟對任一節點進行分裂:
獲得所述節點的標志向量的第一分片、第一梯度向量的第一分片以及第二梯度向量的第一分片;標志向量指示屬于相應節點的樣本,第一梯度向量包括屬于相應節點的樣本對應的第一梯度,第二梯度向量包括屬于相應節點的樣本對應的第二梯度。
對于第一方持有的任一特征:
對于按該特征的特征值劃分樣本集得到的多個第一分組中的每一個:根據各樣本的該特征的特征值生成該第一分組對應的標識向量,該標識向量指示屬于該第一分組的樣本;將該第一分組對應的標識向量拆分成第一分片和第二分片,并將該第一分組對應的標識向量的第二分片發送給第二方的設備;按照多方安全計算協議與第二方的設備交互,以基于所述節點的第一梯度向量的第一分片以及該第一分組對應的標識向量的第一分片,計算該第一分組對應的第一梯度和的第一分片,該第一分組對應的第一梯度和基于所述節點的第一梯度向量的第一分片和第二分片之和與該第一分組對應的標識向量的第一分片和第二分片之和的內積得到;按照多方安全計算協議與第二方的設備交互,以基于所述節點的第二梯度向量的第一分片以及該第一分組對應的標識向量的第一分片,計算該第一分組對應的第二梯度和的第一分片,該第一分組對應的第二梯度和基于所述節點的第二梯度向量的第一分片和第二分片之和與該第一分組對應的標識向量的第一分片和第二分片之和的內積得到。
對于第二方持有的任一特征:
對于按該特征劃分樣本集得到的多個第二分組中的每一個:從所述第二方的設備獲得該第二分組對應的標識向量的第一分片,該標識向量指示屬于該第二分組的樣本;按照多方安全計算協議與第二方的設備交互,以基于所述節點的第一梯度向量的第一分片以及該第二分組對應的標識向量的第一分片,計算該第二分組對應的第一梯度和的第一分片,該第二分組對應的第一梯度和基于所述節點的第一梯度向量的第一分片和第二分片之和與該第二分組對應的標識向量的第一分片和第二分片之和的內積得到;按照多方安全計算協議與第二方的設備交互,以基于所述節點的第二梯度向量的第一分片以及該第二分組對應的標識向量的第一分片,計算該第二分組對應的第二梯度和的第一分片,該第二分組對應的第二梯度和基于所述節點的第二梯度向量的第一分片和第二分片之和與該第二分組對應的標識向量的第一分片和第二分片之和的內積得到。
按照多方安全計算協議與第二方的設備交互,以基于各特征下的各分組分別對應的第一梯度和的第一分片以及第二梯度和的第一分片,計算各特征下的各分組分別對應的分裂增益的第一分片。
按照多方安全比較協議與第二方的設備交互,以基于各特征下的各分組分別對應的分裂增益的第一分片,確定最大分裂增益,并根據所述最大分裂增益對應的特征及分組記錄所述節點的分裂信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010723916.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種帶電檢功能的撕膜機構
- 下一篇:安全鉗提拉裝置、電梯轎廂及其使用方法





