[發明專利]基于樣本加權的業務模型訓練方法、裝置及系統有效
| 申請號: | 202010762022.7 | 申請日: | 2020-07-31 |
| 公開(公告)號: | CN111738453B | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 陳超超;周俊;王力 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京永新同創知識產權代理有限公司 11376 | 代理人: | 林錦輝;劉景峰 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 樣本 加權 業務 模型 訓練 方法 裝置 系統 | ||
本說明書實施例提供基于樣本加權的業務模型訓練方法及系統。第一和第二數據擁有方分別具有第一和第二數據集以及第一和第二模型。第一數據擁有方包括具有標簽權重的數據標簽。各個數據擁有方對所具有的模型和標簽權重進行份額分解并進行共享。在各個數據擁有方之間,使用各個模型份額、第一和第二數據集以及數據標簽,確定各個模型的模型更新量份額。在各個數據擁有方之間,使用各個模型的模型更新量份額以及標簽權重份額,確定各個模型的加權模型更新量份額。各個數據擁有方根據各個加權模型更新量份額更新對應的模型份額。在循環結束時,各個數據擁有方共享更新后的模型份額,并根據更新后的模型份額確定訓練出的第一和第二模型。
技術領域
本說明書實施例通常涉及機器學習領域,尤其涉及基于樣本加權的業務模型訓練方法、裝置及系統。
背景技術
機器學習技術被廣泛地應用于各種業務應用場景。在業務應用場景中,使用機器學習模型作為業務模型來進行各種業務服務。在很多情況下,業務模型需要采用多個數據擁有方的業務數據來進行模型訓練。多個數據擁有方(例如,電子商務公司、快遞公司和銀行)各自擁有訓練業務模型所使用的特征數據的不同部分數據。該多個數據擁有方通常想共同使用彼此的數據來統一訓練業務模型,但又不想把各自的數據提供給其它數據擁有方以防止自己的數據被泄露。
面對這種情況,提出了能夠保護數據安全的業務模型訓練方法,其能夠在保證多個數據擁有方的各自數據安全的情況下,協同該多個數據擁有方來訓練業務模型,以供該多個數據擁有方使用。然而,現有業務模型訓練方法不能適用于訓練樣本的數據標簽具有權重的應用場景。
發明內容
鑒于上述,本說明書實施例提供一種基于樣本加權的業務模型訓練方法、裝置及系統。
根據本說明書實施例的一個方面,提供一種用于經由第一和第二數據擁有方訓練業務模型的方法,第一數據擁有方具有第一數據集、第一模型以及具有標簽權重C的數據標簽Y,第二數據擁有方具有第二數據集和第二模型,第一數據集和第二數據集按照垂直切分方式組成業務模型的訓練樣本,第一模型和第二模型按照垂直切分方式組成業務模型,所述方法由第一數據擁有方執行,所述方法包括:將第一模型和標簽權重C分別分解為第一模型份額和以及標簽權重份額和,并將第一模型份額和標簽權重份額發送給第二數據擁有方;從第二數據擁有方接收第二模型的第二模型份額,第二模型份額經由第二數據擁有方將第二模型分解為第二模型份額和得到;執行下述循環過程,直到滿足循環結束條件:在各個數據擁有方之間,使用第一模型份額和、第二模型份額和、第一數據集和第二數據集以及數據標簽Y,確定第一模型的模型更新量份額和以及第二模型的模型更新量份額和,第一數據擁有方具有模型更新量份額和,以及第二數據擁有方具有模型更新量份額和;在各個數據擁有方之間,使用第一模型的模型更新量份額和、第二模型的模型更新量份額和以及標簽權重份額和,確定第一模型的加權模型更新量份額和以及第二模型的加權模型更新量份額和,第一數據擁有方具有加權模型更新量份額和,以及第二數據擁有方具有加權模型更新量份額和;分別根據加權模型更新量份額和更新第一模型份額和第二模型份額,在未滿足循環結束條件時,更新后的各個數據擁有方處的第一和第二模型份額用作下一循環的當前第一和第二模型份額,第二數據擁有方的第一模型份額和第二模型份額根據加權模型更新量份額和更新,在滿足循環結束條件時,將更新后的第二模型份額發送給第二數據擁有方,并且從第二數據擁有方獲取更新后的第一模型份額;以及根據更新后的第一模型份額和,確定訓練出的第一模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010762022.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種劏鱔魚的裝置
- 下一篇:一種在線實時分析質譜的校正方法及校正裝置





