[發明專利]計算機執行的機器學習模型的訓練方法、裝置及設備有效
| 申請號: | 201910942795.0 | 申請日: | 2019-09-30 |
| 公開(公告)號: | CN110705717B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 張望舒;溫祖杰 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 張明;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 執行 機器 學習 模型 訓練 方法 裝置 設備 | ||
本說明書實施例提供一種計算機執行的機器學習模型的訓練方法、裝置及設備,在訓練方法中,獲取在當前時間段內的增量數據,作為訓練樣本集。基于訓練樣本集,對在上一時間段訓練后的機器學習模型進行增量訓練,得到初始機器學習模型。將測試樣本集中的各測試樣本輸入初始機器學習模型,以得到測試結果。基于測試結果,確定初始機器學習模型的準確率。若準確率大于第一閾值,則將初始機器學習模型作為在當前時間段訓練后的機器學習模型。若準確率不大于第一閾值,則將測試樣本集中測試結果錯誤的測試樣本加入訓練樣本集,得到更新后的訓練樣本集,并基于更新后的訓練樣本集,對初始機器學習模型進行訓練,以得到在當前時間段訓練后的機器學習模型。
技術領域
本說明書一個或多個實施例涉及計算機技術領域,尤其涉及一種計算機執行的機器學習模型的訓練方法、裝置及設備。
背景技術
隨著機器學習的普遍流行,各種機器學習模型越來越受到關注。對于機器學習模型,通常需要先基于訓練數據(也稱訓練樣本)對其進行訓練,之后,利用訓練后的機器學習模型執行某種預測,如,執行類別預測等。
需要說明的是,為了確保訓練后的機器學習模型的準確率,通常需要基于大量的訓練數據對其進行訓練,這就使得模型的訓練過程通常比較復雜。由于模型的訓練過程比較復雜,傳統技術中,通常會在訓練后的機器學習模型的預測能力退化后,才再次啟動模型的訓練過程。因此,基于這種方式訓練的機器學習模型通常適用于數據相對穩定的場景。而對于隨著時間的推移,數據不斷發生變化的場景,模型的預測準確率通常會比較低。
因此,需要提供一種機器學習模型的訓練方法,以適應隨著時間的推移,數據不斷變化的場景。
發明內容
本說明書一個或多個實施例描述了一種計算機執行的機器學習模型的訓練方法、裝置及設備,可以大大提升機器學習模型訓練的準確度和效率。
第一方面,提供了一種計算機執行的機器學習模型的訓練方法,包括:
獲取在當前時間段內的增量數據,作為訓練樣本集;
基于所述訓練樣本集,對在上一時間段訓練后的機器學習模型進行增量訓練,得到當前時間段的初始機器學習模型;
將測試樣本集中的各測試樣本輸入所述初始機器學習模型,以得到所述各測試樣本的測試結果;
基于所述各測試樣本的測試結果,確定所述初始機器學習模型的準確率;
若所述準確率大于第一閾值,則將所述初始機器學習模型作為在當前時間段訓練后的機器學習模型;
若所述準確率不大于第一閾值,則將所述測試樣本集中測試結果錯誤的測試樣本加入所述訓練樣本集,以得到更新后的訓練樣本集,并基于更新后的訓練樣本集,對所述初始機器學習模型進行訓練,以得到在當前時間段訓練后的機器學習模型。
第二方面,提供了一種計算機執行的機器學習模型的訓練裝置,包括:
獲取單元,用于獲取在當前時間段內的增量數據,作為訓練樣本集;
訓練單元,用于基于所述獲取單元獲取的所述訓練樣本集,對在上一時間段訓練后的機器學習模型進行增量訓練,得到當前時間段的初始機器學習模型;
輸入單元,用于將測試樣本集中的各測試樣本輸入所述訓練單元訓練得到的所述初始機器學習模型,以得到所述各測試樣本的測試結果;
確定單元,用于基于所述各測試樣本的測試結果,確定所述初始機器學習模型的準確率;
所述確定單元,還用于若所述準確率大于第一閾值,則將所述初始機器學習模型作為在當前時間段訓練后的機器學習模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910942795.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多模型并行訓練方法
- 下一篇:基于合作博弈的模型解釋方法、裝置、電子設備





