[發明專利]一種模型更新的系統、方法、裝置、終端設備和介質在審
| 申請號: | 201811046230.6 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN110888668A | 公開(公告)日: | 2020-03-17 |
| 發明(設計)人: | 范志軍 | 申請(專利權)人: | 騰訊科技(北京)有限公司 |
| 主分類號: | G06F8/658 | 分類號: | G06F8/658 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘;李娟 |
| 地址: | 100080 北京市海淀區海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 更新 系統 方法 裝置 終端設備 介質 | ||
本申請公開了一種模型更新的系統、方法、裝置、終端設備和介質,屬于計算機技術領域,該方法包括,訓練子系統基于檢測到的新增樣本進行模型訓練,并將訓練獲得的增量更新數據上傳至發布服務器;發布服務器則將存儲的當前全量模型與增量更新數據合并獲得更新后的增量全量模型。這樣,不需要加載全量模型,并且僅將數據量極少的模型增量數據上傳至發布服務器,極大地減少了上傳和加載過程中耗費的時間,提高了處理效率。
技術領域
本申請涉及計算機技術領域,尤其涉及一種模型更新的系統、方法、裝置、終端設備和介質。
背景技術
隨著計算機技術的發展,基于大數據的模型訓練的方式已經得到了廣泛的應用。現有技術下,通常采用批處理(batch)的方式對模型進行訓練以及更新,即每次模型訓練時,將當前全量模型從磁盤加載到內存,并將訓練后獲得的全量模型上傳至發布服務器進行發布,最后將模型占用的資源釋放。
但是,由于每次訓練更新時,都需要對全量模型進行加載,因此,若全量模型的數據量較大,則模型加載以及上傳會耗費大量的時間,模型更新的效率較低。
發明內容
本申請實施例提供一種模型更新的系統、方法、裝置、終端設備和介質,用以對模型進行訓練以及更新時,提高模型訓練以及更新的效率。
一方面,提供一種模型更新的系統,包括:訓練子系統和發布服務器,其中,
訓練子系統,用于確定檢測到新增樣本時,基于新增樣本進行模型訓練,獲得當前全量模型的增量更新數據,并將增量更新數據上傳至發布服務器;
發布服務器,用于將接收的增量更新數據與存儲的當前全量模型進行合并,獲得增量全量模型。
較佳的,訓練子系統還包括調度服務模塊,梯度服務模塊集群,以及參數服務模塊集群,梯度服務模塊集群中至少包括一個梯度服務模塊,參數服務模塊集群中至少包含一個參數服務模塊;
調度服務模塊,用于對新增樣本進行切分后分配至各梯度服務模塊;
每個梯度服務模塊,分別用于基于接收的新增樣本,進行梯度計算處理,并將獲得的梯度值發送至參數服務模塊;
每個參數服務模塊,分別從至少一個梯度服務模塊接收梯度值,并用于基于接收的梯度值,進行參數計算處理,獲得增量更新數據并分別發送給發布服務器。
較佳的,訓練子系統還包括合并服務模塊集群,合并服務模塊集群中至少包含一個合并服務模塊;
合并服務模塊用于:將通過各參數服務模塊獲取的增量更新數據與本地存儲的當前全量模型進行合并,獲得增量全量模型;獲取增量全量模型中的各模型參數的更新信息;篩選出對應的更新信息符合預設的篩選條件的模型參數;基于篩選出的模型參數,獲得裁剪更新數據,并將裁剪更新數據上傳至發布服務器;
發布服務器還用于:基于接收的裁剪更新數據,對增量全量模型進行裁剪更新,獲得目標全量模型。
較佳的,合并服務模塊用于:
獲取當前時間,以及各模型參數的更新信息中包含的更新時間,篩選出當前時間與更新時間之間的時間差高于預設更新時間門限的各模型參數;和/或,
基于獲取的各模型參數的更新信息中包含的創建時間,更新時間和更新次數,分別確定每一模型參數的更新頻率,并篩選出更新頻率低于預設更新頻率門限值的各模型參數。
較佳的,合并服務模塊還用于:
基于裁剪更新數據,對本地存儲的增量全量模型進行裁剪更新,獲得目標全量模型。
較佳的,訓練子系統還包括外部存儲設備,外部存儲設備用于:接收并存儲訓練子系統發送的模型參數。
參數服務模塊還用于:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(北京)有限公司,未經騰訊科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811046230.6/2.html,轉載請聲明來源鉆瓜專利網。





