[發明專利]一種模型訓練方法及裝置,電子設備在審
| 申請號: | 201711308334.5 | 申請日: | 2017-12-11 |
| 公開(公告)號: | CN108280462A | 公開(公告)日: | 2018-07-13 |
| 發明(設計)人: | 王子偉 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練樣本 模型訓練 機器學習模型 訓練目標 預測結果 預測 計算機技術領域 電子設備 模型應用 數據挖掘 融合 申請 搜索 應用 | ||
本申請提供了一種模型訓練方法,屬于計算機技術領域,解決現有技術中模型訓練方法訓練得到的模型應用于數據挖掘或搜索等應用時,預測結果不準確的問題。所述方法包括:根據訓練樣本,獲得至少一份子訓練樣本;根據每份所述子訓練樣本,分別訓練與每份所述子訓練樣本對應的多個機器學習模型,并獲取相應機器學習模型對所述每份子訓練樣本的預測值;根據所述預測值,確定融合訓練樣本;根據所述融合訓練樣本,訓練目標機器學習模型。本申請實施例公開的模型訓練方法,通過將前次訓練得到的模型的預測結果作為特征,進一步進行訓練目標模型,可以有效提升訓練得到的模型的預測效果準確性。
技術領域
本申請涉及計算機技術領域,特別是涉及一種模型訓練方法及裝置,電子設備。
背景技術
隨著平臺數據量的增加,對平臺數據的利用顯得尤為重要。例如:通過平臺數據進行建模,利用預先訓練的模型預測用戶行為或者提供用戶感興趣的數據。現有技術中,比較常用的方法是通過預先訓練一個模型,并通過訓練好的模型對實時數據進行預測。進一步的,為了提升預測數據的準確性,現有技術中出現了一種預先訓練多個模型,然后,通過每個模型分別進行數據預測,最后,將預測結果進行融合,例如,通過將各模型預測的得分加權求和,得到數據的最終預測得分。現有技術中的個模型在訓練時,直接提取平臺數據的預設維度特征,然后基于SVM分類器或神經網絡模型進行訓練。
但是,現有技術中的單個模型的預測效果過于片面,預測結果不夠準確;而多個模型在進行融合時依賴人工設置的融合權重,同樣存在預測結果不準確的問題。
發明內容
本申請提供一種模型訓練方法,解決現有技術中的模型訓練方法訓練得到的模型應用于數據挖掘或搜索等應用時,預測結果不準確的問題。
為了解決上述問題,第一方面,本申請實施例提供了一種模型訓練方法包括:
根據每份所述子訓練樣本,分別訓練與每份所述子訓練樣本對應的多個機器學習模型,并獲取相應機器學習模型對所述每份子訓練樣本的預測值;
根據所述預測值,確定融合訓練樣本;
根據所述融合訓練樣本,訓練目標機器學習模型。
第二方面,本申請實施例提供了一種模型訓練裝置,包括:
采樣模塊,用于根據訓練樣本,獲得至少一份子訓練樣本;
單模型訓練和預測模塊,用于根據每份所述子訓練樣本,分別訓練與每份所述子訓練樣本對應的多個機器學習模型,并獲取相應機器學習模型對所述每份子訓練樣本的預測值;
樣本特征融合模塊,用于根據所述預測值,確定融合訓練樣本;
目標機器模型訓練模塊,用于根據所述樣本特征融合模塊確定的融合訓練樣本,訓練目標機器學習模型。
第三方面,本申請實施例還公開了一種電子設備,包括存儲器、處理器及存儲在所述存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現本申請實施例所述的模型訓練方法。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時本申請實施例公開的模型訓練方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711308334.5/2.html,轉載請聲明來源鉆瓜專利網。





