[發明專利]流式模型訓練方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202111475535.0 | 申請日: | 2021-12-06 |
| 公開(公告)號: | CN113902137B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 鐘子宏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種流式模型訓練方法,其特征在于,包括:
獲取流量樣本數據,并采用機器學習算法訓練所述流量樣本數據,得到第一訓練參數;其中,所述流量樣本數據是在指定時間段內對第一交通場景進行數據采集得到的,且所述流量樣本數據屬于第一數據擁有方;所述第一訓練參數包含流量梯度值;
獲取第二訓練參數,所述第二訓練參數是第二數據擁有方采用所述機器學習算法訓練歷史樣本數據后得到的,所述歷史樣本數據是在先于所述指定時間段內對第二交通場景進行數據采集得到的;所述第二訓練參數包含離線梯度值;
對所述第一訓練參數包含的流量梯度值與所述第二訓練參數包含的離線梯度值進行融合,得到融合后的訓練參數中包含的更新后的流量梯度值,并采用所述融合后的訓練參數包含的更新后的流量梯度值和流量數據總量確定針對目標模型的參數更新指標;
采用所述參數更新指標訓練目標模型的初始的流量模型參數,得到流量模型參數;其中,所述目標模型中設置有所述機器學習算法,訓練完成的目標模型用于進行交通流量預測;
基于所述流量模型參數對所述目標模型進行模型測試,得到所述目標模型的模型測試結果,并在所述模型測試結果指示通過測試時,將基于所述流量模型參數進行交通流量預測;
若所述模型測試結果指示未通過測試,則觸發所述第二數據擁有方對離線模型參數進行測試,并在所述離線模型參數通過測試時,基于所述離線模型參數進行交通流量預測。
2.如權利要求1所述的方法,其特征在于,所述流量樣本數據是從在線流量數據中隨機采樣得到的,所述第一訓練參數包括流量梯度值和流量損失值;
所述采用機器學習算法訓練所述流量樣本數據,得到第一訓練參數,包括:
獲取在目標模型中設置的機器學習算法;其中,所述機器學習算法和所述目標模型相關聯,當所述目標模型為分類模型時,所述機器學習算法對應為分類算法,當所述目標模型為生成模型時,所述機器學習算法對應為回歸算法;
采用獲取得到的機器學習算法對從所述在線流量數據中隨機采樣得到的數據進行訓練,得到所述流量梯度值和所述流量損失值。
3.如權利要求1所述的方法,其特征在于,所述獲取第二訓練參數,包括:
從數據協作方獲取由所述數據協作方對第二訓練參數的密文數據進行解密得到的解密數據;其中,所述第二訓練參數的密文數據是所述第二數據擁有方采用加密公鑰對得到的第二訓練參數進行加密處理后發送到所述數據協作方的,所述加密公鑰是所述第二數據擁有方從所述數據協作方獲取到的;
將獲取到的解密數據作為所述第二訓練參數。
4.如權利要求1所述的方法,其特征在于,所述第一訓練參數包括流量梯度值和流量損失值,所述第二訓練參數包括離線梯度值和離線損失值;所述對所述第一訓練參數與所述第二訓練參數進行融合,得到融合后的訓練參數,包括:
采用所述離線梯度值對所述流量梯度值進行更新,得到更新后的流量梯度值,并采用所述離線損失值對所述流量損失值進行更新,得到更新后的流量損失值;其中,所述更新后的流量梯度值和所述更新后的流量損失值為更新后的第一訓練參數;
將所述更新后的第一訓練參數作為融合后的訓練參數。
5.如權利要求4所述的方法,其特征在于,所述采用所述融合后的訓練參數訓練目標模型,包括:
獲取所述流量樣本數據對應的流量數據總量,并根據所述流量數據總量和所述更新后的流量梯度值,確定針對目標模型的參數更新指標;
獲取所述目標模型的初始模型參數;
采用所述參數更新指標對所述初始模型參數進行更新,得到流量模型參數,其中,訓練完成的目標模型包括取得所述流量模型參數的目標模型。
6.如權利要求4所述的方法,其特征在于,所述采用所述離線梯度值對所述流量梯度值進行更新,得到更新后的流量梯度值,包括:采用所述離線梯度值對所述流量梯度值進行加權,并將加權后的流量梯度值作為更新后的流量梯度值;
所述采用所述離線損失值對所述流量損失值進行更新,得到更新后的流量損失值,包括:采用所述離線損失值對所述流量損失值進行加權,并將加權后的流量損失值作為更新后的流量損失值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111475535.0/1.html,轉載請聲明來源鉆瓜專利網。





