[發(fā)明專利]計算機實現(xiàn)的機器學(xué)習(xí)模型訓(xùn)練方法在審
| 申請?zhí)枺?/td> | 202211540738.8 | 申請日: | 2022-12-02 |
| 公開(公告)號: | CN115936142A | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 陳凱;杜金栗;張譽;段偉民;陳鑫;李伯堂 | 申請(專利權(quán))人: | 騰云天宇科技(北京)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N7/01 |
| 代理公司: | 北京市漢坤律師事務(wù)所 11602 | 代理人: | 魏小薇;吳麗麗 |
| 地址: | 100027 北京市朝陽區(qū)新源南路*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 計算機 實現(xiàn) 機器 學(xué)習(xí) 模型 訓(xùn)練 方法 | ||
提供了一種計算機實現(xiàn)的機器學(xué)習(xí)模型訓(xùn)練方法,包括:從存儲器中讀取原始樣本集合,原始樣本集合包括正樣本集合和負(fù)樣本集合;對負(fù)樣本集合中的負(fù)樣本進(jìn)行多次隨機下采樣,將每次隨機下采樣得到的目標(biāo)數(shù)量的負(fù)樣本作為一個采樣集合,得到多個采樣集合;刪除負(fù)樣本集合中除多個采樣集合外的負(fù)樣本,以釋放原始樣本集合中除多個負(fù)樣本集合外的負(fù)樣本所占用的存儲空間;使用多個采樣集合分別與正樣本集合構(gòu)成目標(biāo)樣本集合,得到與多個采樣集合對應(yīng)的多個目標(biāo)樣本集合;利用多個目標(biāo)樣本集合分別訓(xùn)練相應(yīng)的多個機器學(xué)習(xí)模型,得到多個目標(biāo)預(yù)測模型。
技術(shù)領(lǐng)域
本公開涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種計算機實現(xiàn)的機器學(xué)習(xí)模型訓(xùn)練方法和基于機器學(xué)習(xí)模型的概率預(yù)測方法、裝置、計算機設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,各行各業(yè)對機器學(xué)習(xí)模型的依賴性和認(rèn)可度逐步加強,如何更好地實現(xiàn)對機器學(xué)習(xí)模型的訓(xùn)練以得到理想的目標(biāo)模型也成為了當(dāng)下的研究熱點。相關(guān)技術(shù)中,需要使用大量的樣本數(shù)據(jù)對機器學(xué)習(xí)模型進(jìn)行訓(xùn)練以得到有效且穩(wěn)定的目標(biāo)預(yù)測模型,然而,大規(guī)模的樣本數(shù)據(jù)會占用存儲器中較大的存儲空間,浪費資源且訓(xùn)練效率較低。
在此部分中描述的方法不一定是之前已經(jīng)設(shè)想到或采用的方法。除非另有指明,否則不應(yīng)假定此部分中描述的任何方法僅因其包括在此部分中就被認(rèn)為是現(xiàn)有技術(shù)。類似地,除非另有指明,否則此部分中提及的問題不應(yīng)認(rèn)為在任何現(xiàn)有技術(shù)中已被公認(rèn)。
發(fā)明內(nèi)容
提供一種緩解、減輕或甚至消除上述問題中的一個或多個的機制將是有利的。
根據(jù)本公開的一方面,提供了一種計算機實現(xiàn)的機器學(xué)習(xí)模型訓(xùn)練方法,包括:從存儲器中讀取原始樣本集合,所述原始樣本集合包括正樣本集合和負(fù)樣本集合;對所述負(fù)樣本集合中的負(fù)樣本進(jìn)行多次隨機下采樣,將每次隨機下采樣得到的目標(biāo)數(shù)量的負(fù)樣本作為一個采樣集合,得到多個采樣集合;刪除所述負(fù)樣本集合中除所述多個采樣集合外的負(fù)樣本,以釋放所述原始樣本集合中除所述多個負(fù)樣本集合外的負(fù)樣本所占用的存儲空間;使用所述多個采樣集合分別與所述正樣本集合構(gòu)成目標(biāo)樣本集合,得到與所述多個采樣集合一一對應(yīng)的多個目標(biāo)樣本集合;利用所述多個目標(biāo)樣本集合分別訓(xùn)練相應(yīng)的多個機器學(xué)習(xí)模型,得到多個目標(biāo)預(yù)測模型。
根據(jù)本公開的另一方面,提供了一種基于機器學(xué)習(xí)模型的概率預(yù)測方法,包括:獲取待預(yù)測樣本數(shù)據(jù);利用所述多個目標(biāo)預(yù)測模型分別處理所述待預(yù)測樣本數(shù)據(jù),得到所述多個目標(biāo)預(yù)測模型輸出的相應(yīng)多個預(yù)測概率值;確定所述多個預(yù)測概率值的平均值作為針對所述待預(yù)測樣本數(shù)據(jù)的目標(biāo)預(yù)測結(jié)果。
根據(jù)本公開的又另一方面,提供了一種計算機實現(xiàn)的機器學(xué)習(xí)模型訓(xùn)練裝置,包括:第一數(shù)據(jù)獲取模塊,用于從存儲器中讀取原始樣本集合,所述原始樣本集合包括正樣本集合和負(fù)樣本集合;隨機采樣模塊,用于對所述負(fù)樣本集合中的負(fù)樣本進(jìn)行多次隨機下采樣,將每次隨機下采樣得到的目標(biāo)數(shù)量的負(fù)樣本作為一個采樣集合,得到多個采樣集合;數(shù)據(jù)過濾模塊,用于刪除所述負(fù)樣本集合中除所述多個采樣集合外的負(fù)樣本,以釋放所述原始樣本集合中除所述多個負(fù)樣本集合外的負(fù)樣本所占用的存儲空間;集合生成模塊,用于使用所述多個采樣集合分別與所述正樣本集合構(gòu)成目標(biāo)樣本集合,得到與所述多個采樣集合一一對應(yīng)的多個目標(biāo)樣本集合;模型訓(xùn)練模塊,用于利用所述多個目標(biāo)樣本集合分別訓(xùn)練相應(yīng)的多個機器學(xué)習(xí)模型,得到多個目標(biāo)預(yù)測模型。
根據(jù)本公開的又另一方面,提供了一種基于機器學(xué)習(xí)模型的概率預(yù)測裝置,包括:第二數(shù)據(jù)獲取模塊,用于獲取待預(yù)測樣本數(shù)據(jù);數(shù)據(jù)處理模塊,用于利用所述多個目標(biāo)預(yù)測模型分別處理所述待預(yù)測樣本數(shù)據(jù),得到所述多個目標(biāo)預(yù)測模型輸出的相應(yīng)多個預(yù)測概率值;結(jié)果生成模塊,用于確定所述多個預(yù)測概率值的平均值作為針對所述待預(yù)測樣本數(shù)據(jù)的目標(biāo)預(yù)測結(jié)果。
根據(jù)本公開的又另一方面,提供了一種計算機設(shè)備,包括:至少一個處理器;以及至少一個存儲器,其上存儲有計算機程序,其中,所述計算機程序在被所述至少一個處理器執(zhí)行時,使所述至少一個處理器執(zhí)行如上所述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰云天宇科技(北京)有限公司,未經(jīng)騰云天宇科技(北京)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211540738.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 互動業(yè)務(wù)終端、實現(xiàn)系統(tǒng)及實現(xiàn)方法
- 街景地圖的實現(xiàn)方法和實現(xiàn)系統(tǒng)
- 游戲?qū)崿F(xiàn)系統(tǒng)和游戲?qū)崿F(xiàn)方法
- 圖像實現(xiàn)裝置及其圖像實現(xiàn)方法
- 增強現(xiàn)實的實現(xiàn)方法以及實現(xiàn)裝置
- 軟件架構(gòu)的實現(xiàn)方法和實現(xiàn)平臺
- 數(shù)值預(yù)報的實現(xiàn)方法及實現(xiàn)系統(tǒng)
- 空調(diào)及其冬眠控制模式實現(xiàn)方法和實現(xiàn)裝置以及實現(xiàn)系統(tǒng)
- 空調(diào)及其睡眠控制模式實現(xiàn)方法和實現(xiàn)裝置以及實現(xiàn)系統(tǒng)
- 輸入設(shè)備實現(xiàn)方法及其實現(xiàn)裝置
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





