[發(fā)明專利]機器學習模型訓練方法、裝置和計算機設備有效
| 申請?zhí)枺?/td> | 201710322670.9 | 申請日: | 2017-05-09 |
| 公開(公告)號: | CN108304935B | 公開(公告)日: | 2022-01-18 |
| 發(fā)明(設計)人: | 劉成烽;鄭博;黃鞏怡;段培 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 機器 學習 模型 訓練 方法 裝置 計算機 設備 | ||
1.一種機器學習模型訓練方法,包括:
獲取通過社交平臺的用戶標識相關聯的第一用戶數據及第一標簽;所述第一標簽源自第一業(yè)務,所述第一用戶數據為所述第一業(yè)務的用戶在所述社交平臺中的用戶數據;
獲取通過所述社交平臺的用戶標識相關聯的第二用戶數據及第二標簽;所述第二用戶數據為第二業(yè)務的用戶在所述社交平臺中的用戶數據,所述第二標簽源自第二業(yè)務;所述第一業(yè)務和所述第二業(yè)務均通過所述社交平臺的用戶標識登錄,為通過所述社交平臺進行訪問的、不同領域的業(yè)務;
根據包括通過所述用戶標識相關聯的所述第一用戶數據和第三用戶數據的組合,以及與所述第一用戶數據相關聯的所述第一標簽的訓練樣本,訓練機器學習模型;所述第三用戶數據,是從相應的用戶標識所對應的源自于所述第一業(yè)務的用戶數據映射至所述第二業(yè)務的用戶數據;
通過所述機器學習模型對所述第二用戶數據進行分類;
根據所述分類得到的結果和相應第二用戶數據所關聯的第二標簽,調整所述訓練樣本的權重分布;
根據調整權重分布后的所述訓練樣本繼續(xù)訓練機器學習模型,直至滿足訓練停止條件時停止訓練,得到針對所述第二業(yè)務的機器學習模型。
2.根據權利要求1所述的方法,其特征在于,所述第一標簽中包含所述第二業(yè)務所缺失的標簽。
3.根據權利要求1所述的方法,其特征在于,所述根據所述分類得到的結果和相應第二用戶數據所關聯的第二標簽,調整所述訓練樣本的權重分布,包括:
根據所述分類得到的結果和相應第二用戶數據所關聯的第二標簽,確定所述機器學習模型的分類性能參數;
根據所述分類性能參數確定權重縮放參數;
根據所述權重縮放參數調整所述訓練樣本的權重分布。
4.根據權利要求3所述的方法,其特征在于,當所述分類性能參數為分類正確率時,所述權重縮放參數為與相應權重相乘以調整所述權重分布的正系數,且與所述分類正確率負相關;
當所述分類性能參數為分類錯誤率時,所述權重縮放參數為與相應權重相乘以調整所述權重分布的正系數,且與所述分類錯誤率正相關。
5.根據權利要求1所述的方法,其特征在于,所述訓練樣本還包括所述第二用戶數據和相關聯的所述第二標簽。
6.根據權利要求5所述的方法,其特征在于,所述根據所述分類得到的結果和相應第二用戶數據所關聯的第二標簽,調整所述訓練樣本的權重分布,包括:
當對第二用戶數據進行分類得到的結果與相應第二用戶數據所關聯的第二標簽不一致時,將相應第二用戶數據所在訓練樣本的權重占比調高。
7.根據權利要求6所述的方法,其特征在于,所述根據所述分類得到的結果和相應第二用戶數據所關聯的第二標簽,調整所述訓練樣本的權重分布還包括:
通過所述機器學習模型對所述第一用戶數據進行分類;
當對所述第一用戶數據進行分類的結果與相應第一用戶數據所關聯的第一標簽不一致時,將相應第一用戶數據所在訓練樣本的權重占比調低。
8.根據權利要求1所述的方法,其特征在于,所述通過所述機器學習模型對第二用戶數據進行分類,包括:
對于第二用戶數據及與所述第二用戶數據通過用戶標識相關聯的源自所述第二業(yè)務的用戶數據的組合,進行分類。
9.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取在所述第一業(yè)務和所述第二業(yè)務均存在用戶數據的用戶標識;
查詢與獲取的所述用戶標識對應的源自第一業(yè)務的用戶數據,以及與獲取的所述用戶標識對應的源自第二業(yè)務的用戶數據;
根據查詢到的源自第一業(yè)務的用戶數據和源自第二業(yè)務的用戶數據,構建第一業(yè)務的用戶數據映射至第二業(yè)務的用戶數據的映射關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710322670.9/1.html,轉載請聲明來源鉆瓜專利網。





