[發明專利]計算機執行的機器學習模型的訓練方法、裝置及設備有效
| 申請號: | 201910942795.0 | 申請日: | 2019-09-30 |
| 公開(公告)號: | CN110705717B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 張望舒;溫祖杰 | 申請(專利權)人: | 支付寶(杭州)信息技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京億騰知識產權代理事務所(普通合伙) 11309 | 代理人: | 張明;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 計算機 執行 機器 學習 模型 訓練 方法 裝置 設備 | ||
1.一種計算機執行的問答匹配模型的訓練方法,所述問答匹配模型用于基于用戶的用戶問句匹配對應的標準問句;所述方法包括:
獲取在當前時間段內的增量數據,作為訓練樣本集;所述訓練樣本集中的樣本包括:用戶問句和標簽值,所述標簽值指示用戶問句對應的標準問句;所述增量數據是在當前時間段內發生變化的數據;
基于所述訓練樣本集,對在上一時間段訓練后的問答匹配模型進行增量訓練,得到當前時間段的初始問答匹配模型;
將測試樣本集中的各測試樣本輸入所述初始問答匹配模型,以得到所述各測試樣本的測試結果;
基于所述各測試樣本的測試結果,確定所述初始問答匹配模型的準確率;
若所述準確率大于第一閾值,則將所述初始問答匹配模型作為在當前時間段訓練后的問答匹配模型;
若所述準確率不大于第一閾值,則將所述測試樣本集中測試結果錯誤的測試樣本加入所述訓練樣本集,以得到更新后的訓練樣本集,并基于更新后的訓練樣本集,對所述初始問答匹配模型進行訓練,以得到在當前時間段訓練后的問答匹配模型。
2.根據權利要求1所述的方法,還包括:
從所述訓練樣本集中選取預測誤差低于第二閾值的第一訓練樣本;
將所述第一訓練樣本加入所述測試樣本集,以得到更新后的測試樣本集;
將更新后的測試樣本集作為下一時間段的測試樣本集。
3.根據權利要求2所述的方法,所述第一訓練樣本具有對應的標簽值;所述第一訓練樣本的預測誤差基于當前時間段訓練后的問答匹配模型針對所述第一訓練樣本的預測值和所述標簽值確定。
4.根據權利要求1所述的方法,所述基于更新后的訓練樣本集,對所述初始問答匹配模型進行訓練,以得到在當前時間段訓練后的問答匹配模型,包括:
迭代地執行以下步驟,直至訓練后的初始問答匹配模型的準確率大于所述第一閾值:
基于更新后的訓練樣本集,對所述初始問答匹配模型進行訓練;
利用所述測試樣本集,對訓練后的初始問答匹配模型進行測試;
判斷訓練后的初始問答匹配模型的準確率是否大于所述第一閾值;
若不大于,則基于所述測試樣本集中測試結果錯誤的測試樣本,再次對所述更新后的訓練樣本集進行更新;
迭代結束后,將在最后一輪迭代過程中訓練后的初始問答匹配模型作為在當前時間段訓練后的問答匹配模型。
5.一種計算機執行的問答匹配模型的訓練裝置,所述問答匹配模型用于基于用戶的用戶問句匹配對應的標準問句;所述裝置包括:
獲取單元,用于獲取在當前時間段內的增量數據,作為訓練樣本集;所述訓練樣本集中的樣本包括:用戶問句和標簽值,所述標簽值指示用戶問句對應的標準問句;所述增量數據是在當前時間段內發生變化的數據;
訓練單元,用于基于所述獲取單元獲取的所述訓練樣本集,對在上一時間段訓練后的問答匹配模型進行增量訓練,得到當前時間段的初始問答匹配模型;
輸入單元,用于將測試樣本集中的各測試樣本輸入所述訓練單元訓練得到的所述初始問答匹配模型,以得到所述各測試樣本的測試結果;
確定單元,用于基于所述各測試樣本的測試結果,確定所述初始問答匹配模型的準確率;
所述確定單元,還用于若所述準確率大于第一閾值,則將所述初始問答匹配模型作為在當前時間段訓練后的問答匹配模型;
所述確定單元,還用于若所述準確率不大于第一閾值,則將所述測試樣本集中測試結果錯誤的測試樣本加入所述訓練樣本集,以得到更新后的訓練樣本集,并基于更新后的訓練樣本集,對所述初始問答匹配模型進行訓練,以得到在當前時間段訓練后的問答匹配模型。
6.根據權利要求5所述的裝置,還包括:
選取單元,用于從所述訓練樣本集中選取預測誤差低于第二閾值的第一訓練樣本;
更新單元,用于將所述選取單元選取的所述第一訓練樣本加入所述測試樣本集,以得到更新后的測試樣本集;
所述確定單元,還用于將所述更新單元更新后的測試樣本集作為下一時間段的測試樣本集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于支付寶(杭州)信息技術有限公司,未經支付寶(杭州)信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910942795.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多模型并行訓練方法
- 下一篇:基于合作博弈的模型解釋方法、裝置、電子設備





