[發明專利]一種梯度提升樹模型的預測方法、裝置及系統在審
| 申請號: | 202010061981.6 | 申請日: | 2020-01-19 |
| 公開(公告)號: | CN111242385A | 公開(公告)日: | 2020-06-05 |
| 發明(設計)人: | 姚雷;姚平;韓松江;李蒙;牛寶梅 | 申請(專利權)人: | 蘇寧云計算有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06N20/00 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 張慧娟 |
| 地址: | 210000 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 梯度 提升 模型 預測 方法 裝置 系統 | ||
本發明公開了一種梯度提升樹模型的預測方法、裝置及系統,屬于機器學習領域,方法包括:第一數據方基于待測用戶的第一特征數據以及預先與第二數據方聯合訓練生成的梯度提升樹模型,獲取第一特征數據在梯度提升樹模型中所對應的節點值;接收第二數據方通過區塊鏈發送的待測用戶的第二特征數據在梯度提升樹模型中所對應的節點值;基于第一特征數據對應的節點值、第二特征數據對應的節點值以及梯度提升樹模型,對待測用戶進行標簽預測。本發明在實現梯度提升樹模型的預測過程中,保證了兩個數據方都不能獲取對方的特征數據,避免了泄露雙方持有的特征數據。
技術領域
本發明涉及機器學習領域,特別涉及一種梯度提升樹模型的預測方法、裝置及系統。
背景技術
梯度提升樹,屬于機器學習范疇,在傳統機器學習算法里面是對真實分布擬合的最好的幾種算法之一。它是一種迭代的決策樹算法,該算法由多棵決策樹組成,所有樹的結論累加起來做最終答案。
企業通常都擁有大量的用戶特征數據。對這些用戶,企業可以使用這些特征來訓練梯度提升樹,來預測用戶行為。
目前來說,企業對自己擁有的數據源的價值挖掘通常已經比較徹底,急需通過與其企業數據源合作,對數據聯合訓練生成,來擴大數據分析來源,以挖掘出更多的價值。但是用戶特征在不同企業之間是保密的。所以兩個企業如果進行合作聯合訓練生成和預測數據,一般有以下幾種方法:
1,數據托管:各方將數據托管到交易中心,由中心與外部進行數據交易,這樣數據就由中心所有,參與方丟失數據所有權。
2,聚合中心:中心充當傳輸樞紐并通過接口將各方數據鏈接起來,這樣中心有能力、有機會留存交易數據。
3,數據隔離域:各方將數據集中至隔離域為參與方提供服務,這樣隔離域往往由強勢機構負責運營,弱勢方存在出讓數據所有權風險。
4,數據買賣:交易方之間通過數據價值評估進行數據源交易,議價權往往由強勢方掌握,且存在泄露用戶數據隱私等的法律風險。
可見,現有技術中在對兩方企業相同的用戶進行預測數據時,存在泄露雙方的用戶原始特征數據的風險。
發明內容
為了克服上述技術缺陷,本發明提供一種梯度提升樹模型的預測方法、裝置及系統,在對兩方企業相同的用戶進行預測數據過程中,能夠保證兩個數據方都不能獲取對方的原始特征數據,避免泄露雙方持有的特征數據。
本發明實施例提供的具體技術方案如下:
第一方面,提供一種梯度提升樹模型的預測方法,應用于第一數據方,所述方法包括:
基于待測用戶的第一特征數據以及預先與第二數據方聯合訓練生成的梯度提升樹模型,獲取所述第一特征數據在所述梯度提升樹模型中所對應的節點值;
接收所述第二數據方通過區塊鏈發送的所述待測用戶的第二特征數據在所述梯度提升樹模型中所對應的節點值;
基于所述第一特征數據對應的節點值、所述第二特征數據對應的節點值以及所述梯度提升樹模型,對所述待測用戶進行標簽預測。
進一步地,所述基于待測用戶的第一特征數據以及預先與第二數據方聯合訓練生成的梯度提升樹模型,獲取所述第一特征數據在所述梯度提升樹模型中所對應的節點值,包括:
提取所述梯度提升樹模型中的回歸樹的所有特征切分變量以及各所述特征切分變量對應的切分點,并在所述所有特征切分變量中確定出屬于所述第一數據方的目標特征切分變量;
將所述第一特征數據與所述目標特征切分變量對應的切分點進行比較,根據比較結果,獲取所述第一特征數據在所述梯度提升樹模型中對應的節點值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云計算有限公司,未經蘇寧云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010061981.6/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





