[發明專利]一種模型更新的系統、方法、裝置、終端設備和介質在審
| 申請號: | 201811046230.6 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN110888668A | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 范志軍 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F8/658 | 分類號: | G06F8/658 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘;李娟 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 更新 系統 方法 裝置 終端設備 介質 | ||
1.一種模型更新系統,其特征在于,包括:訓練子系統和發布服務器,其中,
所述訓練子系統,用于確定檢測到新增樣本時,基于所述新增樣本進行模型訓練,獲得當前全量模型的增量更新數據,并將所述增量更新數據上傳至所述發布服務器;
所述發布服務器,用于將接收的增量更新數據與存儲的當前全量模型進行合并,獲得增量全量模型。
2.如權利要求1所述的系統,其特征在于,所述訓練子系統還包括調度服務模塊,梯度服務模塊集群,以及參數服務模塊集群,所述梯度服務模塊集群中至少包括一個梯度服務模塊,所述參數服務模塊集群中至少包含一個參數服務模塊;
所述調度服務模塊,用于對新增樣本進行切分后分配至各梯度服務模塊;
每個梯度服務模塊,分別用于基于接收的新增樣本,進行梯度計算處理,并將獲得的梯度值發送至所述參數服務模塊;
每個參數服務模塊,分別從至少一個梯度服務模塊接收梯度值,并用于基于接收的梯度值,進行參數計算處理,獲得增量更新數據并分別發送給所述發布服務器。
3.如權利要求1所述的系統,其特征在于,所述訓練子系統還包括合并服務模塊集群,所述合并服務模塊集群中至少包含一個合并服務模塊;
所述合并服務模塊用于:將通過各參數服務模塊獲取的所述增量更新數據與本地存儲的當前全量模型進行合并,獲得增量全量模型;獲取所述增量全量模型中的各模型參數的更新信息;篩選出對應的更新信息符合預設的篩選條件的模型參數;基于篩選出的模型參數,獲得裁剪更新數據,并將所述裁剪更新數據上傳至所述發布服務器;
所述發布服務器還用于:基于接收的裁剪更新數據,對所述增量全量模型進行裁剪更新,獲得目標全量模型。
4.如權利要求3所述的系統,其特征在于,所述合并服務模塊用于:
獲取當前時間,以及各模型參數的更新信息中包含的更新時間,篩選出所述當前時間與更新時間之間的時間差高于預設更新時間門限的各模型參數;和/或,
基于獲取的各模型參數的更新信息中包含的創建時間,更新時間和更新次數,分別確定每一模型參數的更新頻率,并篩選出更新頻率低于預設更新頻率門限值的各模型參數。
5.如權利要求3所述的系統,其特征在于,所述合并服務模塊還用于:
基于所述裁剪更新數據,對本地存儲的增量全量模型進行裁剪更新,獲得目標全量模型。
6.如權利要求1-5任一項所述的系統,其特征在于,所述訓練子系統還包括外部存儲設備,所述外部存儲設備用于:接收并存儲所述訓練子系統發送的模型參數;
所述參數服務模塊還用于:
將指定的模型參數存儲至內存,并在未指定的各模型參數中,將使用間隔時間高于預設存儲時間門限或者使用頻率低于預設存儲頻率門限的未指定的各模型參數發送至外部存儲設備,以及將其余的模型參數存儲至本地設置的緩沖模塊。
7.如權利要求2所述的系統,其特征在于,所述訓練子系統還包括狀態存儲設備,所述狀態存儲設備用于:接收并存儲所述調度服務模塊發送的運行狀態信息以及運行指令信息;
所述調度服務模塊還用于:向所述狀態存儲設備發送運行狀態信息以及運行指令信息。
8.一種模型更新方法,其特征在于,包括:
確定檢測到新增樣本時,基于所述新增樣本進行模型訓練,獲得當前全量模型的增量更新數據;
將所述增量更新數據上傳至所述發布服務器,觸發所述發布服務器將接收的增量更新數據與存儲的當前全量模型進行合并獲得增量全量模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811046230.6/1.html,轉載請聲明來源鉆瓜專利網。





