[發明專利]數據處理方法、裝置、設備及介質在審
| 申請號: | 202010787194.X | 申請日: | 2020-08-06 |
| 公開(公告)號: | CN111898767A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 衣志昊;程勇;劉洋;陳天健 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 郭春芳 |
| 地址: | 518000 廣東省深圳市前海深港合作區前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 設備 介質 | ||
1.一種數據處理方法,其特征在于,應用于第一參與方,所述數據處理方法包括:
獲取樣本數據,所述樣本數據包括用戶數據和物品數據;
在所述第一參與方本地,確定所述用戶數據的用戶嵌入向量,并接收服務器發送的物品嵌入向量,所述物品嵌入向量為在所述服務器本地基于所述物品數據生成的;
基于所述用戶嵌入向量以及所述物品嵌入向量,通過聯邦學習訓練得到所述第一參與方的預設預測模型。
2.如權利要求1所述數據處理方法,其特征在于,所述在所述第一參與方本地,確定所述用戶數據的用戶嵌入向量,并接收服務器發送的物品嵌入向量的步驟,包括:
在所述第一參與方本地,生成所述用戶數據的獨熱編碼,基于所述獨熱編碼得到所述用戶數據的用戶嵌入向量;
接收服務器端發送的,基于預設物品預測模型得到的物品嵌入向量。
3.如權利要求2所述數據處理方法,其特征在于,所述接收服務器端發送的,基于預設物品預測模型得到的物品嵌入向量的步驟,包括:
接收服務器端發送的將所述物品數據輸入至對應預設物品預測模型中后,得到的表示物品特征的物品嵌入向量;
其中,所述預設物品預測模型是基于具有預設標簽的物品訓練數據,對第一預設待訓練預測模型進行迭代訓練后,獲得的目標模型。
4.如權利要求1所述數據處理方法,其特征在于,所述基于所述用戶嵌入向量以及所述物品嵌入向量,通過聯邦學習訓練得到所述第一參與方的預設預測模型的步驟,包括:
將樣本數據中同一用戶的所述用戶嵌入向量以及所述物品嵌入向量進行向量合并,得到同一用戶的整合向量;
獲取第二待訓練基礎模型,基于多個所述整合向量,對所述第二待訓練基礎模型進行訓練更新,直至所述第二待訓練基礎模型達到第一預設訓練完成條件,得到初始訓練模型,對所述初始訓練模型中的物品模型變量,執行預設橫向聯邦流程,直至所述第二待訓練基礎模型達到第二預設訓練完成條件,得到預設預測模型。
5.如權利要求4所述數據處理方法,其特征在于,所述獲取第二待訓練基礎模型,基于多個所述整合向量,對所述第二待訓練基礎模型進行訓練更新,直至所述第二待訓練基礎模型達到第一預設訓練完成條件,得到初始訓練模型,對所述初始訓練模型中的物品模型變量,執行預設橫向聯邦流程,直至所述第二待訓練基礎模型達到第二預設訓練完成條件,得到預設預測模型的步驟,包括:
獲取第二待訓練基礎模型;
基于多個所述整合向量,對所述第二待訓練基礎模型進行迭代訓練,以對所述第二待訓練基礎模型中的物品模型變量進行訓練更新,并判斷訓練更新后的所述第二待訓練基礎模型是否達到第一預設訓練完成條件;
若訓練更新后的所述第二待訓練基礎模型達到所述第一預設訓練完成條件,將訓練更新后的所述第二待訓練基礎模型設為初始訓練模型;
將所述初始訓練模型中的物品模型變量發送至所述服務器端,以供所述服務器端對多個其他第二參與方發送的物品模型變量,以及所述初始訓練模型中的物品模型變量進行聚合處理,獲得聚合物品模型變量;
接收所述服務器端反饋的所述聚合物品模型變量,并將訓練更新的所述初始訓練模型的物品模型變量替換更新為所述聚合物品模型變量;
基于替換更新后的所述物品模型變量,重新進行對所述第二待訓練基礎模型的迭代訓練和是否達到所述第一預設訓練完成條件的判斷,直至所述第二待訓練基礎模型達到第二預設訓練完成條件,得到預設預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司,未經深圳前海微眾銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010787194.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數字顯示器及升級方法
- 下一篇:壓縮機的控制方法、裝置及空調系統





