[發明專利]一種針對目標場景的預測模型訓練方法及裝置在審
| 申請號: | 201810958151.6 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109214436A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 曾利彬 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京博思佳知識產權代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標場景 目標訓練樣本 預測模型訓練 備選 預測誤差 樣本集 迭代 預設 優選 訓練樣本集 迭代處理 迭代結束 結束條件 篩選規則 訓練樣本 樣本輸入 預測模型 合并 加權 樣本 標簽 輸出 預測 | ||
1.一種針對目標場景的預測模型訓練方法,該方法包括:
獲得N個源場景的N個帶有標簽的源訓練樣本集、及1個目標場景的1個帶有標簽的目標訓練樣本集;其中,N為預設正整數;
利用以下步驟進行迭代處理,直到達到預設結束條件:
針對N個源訓練樣本集中的每一樣本集:將該樣本集與目標訓練樣本集進行合并;利用合并得到的樣本集,訓練得到備選模型;將目標訓練樣本集中的各樣本輸入備選模型,根據模型輸出的預測值及各樣本的標簽值,計算該模型的預測誤差;
將所訓練的N個備選模型中預測誤差最小的模型,作為本次迭代得到的優選模型;
迭代結束后,根據預設篩選規則,從各次迭代得到的各優選模型中,選擇全部或部分模型進行加權,得到針對目標場景的預測模型;其中,進行加權的任一優選模型的權重根據該模型的預測誤差確定,并且預測誤差與所確定權重的關系為負相關。
2.根據權利要求1所述的方法,在第一次迭代處理前,還包括:
確定所獲得的N+1個樣本集中各樣本的預設樣本權重;所述樣本權重用于表示對應樣本在樣本集中的重要程度。
3.根據權利要求2所述的方法,所述迭代處理步驟,還包括:
針對所獲得的N+1個樣本集中的任一樣本:根據預設的更新參數、及預設的更新規則,對本次迭代中該樣本的樣本權重進行更新,更新后的樣本權重用于下次迭代;
其中,預設的更新參數包括:該樣本的標簽值、及將該樣本輸入本次迭代得到的優選模型后輸出的預測值。
4.根據權利要求3所述的方法,所述根據預設的更新參數、及預設的更新規則,對本次迭代中該樣本的樣本權重進行更新,包括:
確定該樣本的標簽值、及將該樣本輸入本次迭代得到的優選模型后輸出的預測值;
利用所確定標簽值與預測值的差值的絕對值,對本次迭代中該樣本的樣本權重進行更新;
其中,在該樣本為N個源訓練樣本集中的樣本的情況下,更新結果與該絕對值的關系為負相關;在該樣本為目標訓練樣本集中的樣本的情況下,更新結果與該絕對值的關系為正相關。
5.根據權利要求1所述的方法,所述預設結束條件,包括:
迭代次數達到預設次數閾值;和/或
本次迭代得到的優選模型的預測誤差小于預設誤差閾值。
6.根據權利要求1所述的方法,所述根據模型輸出的預測值及各樣本的標簽值,計算該模型的預測誤差,包括:
獲得該模型輸出的各樣本的預測值、以及各樣本的標簽值,并且確定各樣本的預測值與標簽值的差值;
確定預設的各樣本的誤差計算權重;
利用所確定的各樣本的誤差計算權重,對所確定的各樣本的差值進行加權求和,得到該模型的預測誤差。
7.根據權利要求6所述的方法,所述確定預設的各樣本的誤差計算權重,包括:
對于輸入該模型的任一樣本:獲得本次迭代中該樣本的樣本權重,并將該樣本權重確定為本次計算預測誤差時該樣本的誤差計算權重;
其中,所述樣本權重為預先設定和/或在迭代中計算得到,且用于表示對應樣本在樣本集中的重要程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810958151.6/1.html,轉載請聲明來源鉆瓜專利網。





