[發(fā)明專利]用于訓(xùn)練機器學(xué)習(xí)模型的方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201811041753.1 | 申請日: | 2018-09-07 |
| 公開(公告)號: | CN110895718A | 公開(公告)日: | 2020-03-20 |
| 發(fā)明(設(shè)計)人: | 孫承根;焦英翔;石光川 | 申請(專利權(quán))人: | 第四范式(北京)技術(shù)有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京銘碩知識產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 徐璐璐;曾世驍 |
| 地址: | 100085 北京市海淀區(qū)上*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 訓(xùn)練 機器 學(xué)習(xí) 模型 方法 系統(tǒng) | ||
提供了一種用于訓(xùn)練機器學(xué)習(xí)模型的方法及系統(tǒng)。所述方法包括:獲取用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置;以及使用針對機器學(xué)習(xí)模型的模型訓(xùn)練框架對獲取的配置進行解析,并執(zhí)行解析得到的用于訓(xùn)練機器學(xué)習(xí)模型的處理邏輯,以訓(xùn)練出機器學(xué)習(xí)模型,其中,用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置包括以下配置之中的至少一種:算法配置,用于限定用于訓(xùn)練機器學(xué)習(xí)模型的機器學(xué)習(xí)算法的運算邏輯;輸入配置,用于限定所述機器學(xué)習(xí)算法的輸入數(shù)據(jù);參數(shù)配置,用于限定機器學(xué)習(xí)模型的參數(shù);以及環(huán)境配置,用于限定訓(xùn)練機器學(xué)習(xí)模型時的環(huán)境。根據(jù)所述方法及系統(tǒng),能夠基于用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置訓(xùn)練出機器學(xué)習(xí)模型。
技術(shù)領(lǐng)域
本發(fā)明總體說來涉及機器學(xué)習(xí)領(lǐng)域,更具體地講,涉及一種用于訓(xùn)練機器學(xué)習(xí)模型的方法及系統(tǒng)。
背景技術(shù)
隨著海量數(shù)據(jù)的出現(xiàn),人們傾向于使用機器學(xué)習(xí)技術(shù)來從數(shù)據(jù)中挖掘出價值。機器學(xué)習(xí)是人工智能研究發(fā)展到一定階段的必然產(chǎn)物,其致力于通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能。在計算機系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,通過機器學(xué)習(xí)算法,可從數(shù)據(jù)中產(chǎn)生“模型”,也就是說,將經(jīng)驗數(shù)據(jù)提供給機器學(xué)習(xí)算法,就能基于這些經(jīng)驗數(shù)據(jù)產(chǎn)生模型;在面對新的情況時,利用訓(xùn)練好的模型來得到相應(yīng)的預(yù)測結(jié)果。
現(xiàn)階段,基于經(jīng)驗數(shù)據(jù)產(chǎn)生模型的基本過程主要包括:
1、導(dǎo)入包含歷史數(shù)據(jù)記錄的數(shù)據(jù)集(例如,數(shù)據(jù)表);
2、完成特征工程,其中,通過對數(shù)據(jù)集中的數(shù)據(jù)記錄的屬性信息進行各種處理,以得到各個特征,這些特征構(gòu)成的特征向量可作為機器學(xué)習(xí)樣本;
3、訓(xùn)練模型,其中,按照設(shè)置的機器學(xué)習(xí)算法(例如,邏輯回歸算法、決策樹算法、神經(jīng)網(wǎng)絡(luò)算法等),基于經(jīng)過特征工程所得到的機器學(xué)習(xí)樣本來學(xué)習(xí)出模型。
當(dāng)前的機器學(xué)習(xí)平臺或系統(tǒng)的模型訓(xùn)練框架的底層大多使用C語言來實現(xiàn),其特點是運行效率高,但使用門檻較高,不適合用戶直接使用。因此,通常由開發(fā)人員使用腳本語言(例如,python)對底層代碼進行一層封裝,這樣,用戶可通過使用腳本語言編寫用于調(diào)用模型訓(xùn)練框架的底層接口的可運行代碼(也即,腳本),來實現(xiàn)調(diào)用模型訓(xùn)練框架提供的處理邏輯。然而,考慮到算法本身的復(fù)雜度以及框架所支持算法的不斷擴充,目前缺乏有效的用戶交互方式,導(dǎo)致用戶難以方便地研發(fā)各種機器學(xué)習(xí)模型。
發(fā)明內(nèi)容
本發(fā)明的示例性實施例在于提供一種用于訓(xùn)練機器學(xué)習(xí)模型的方法及系統(tǒng),其能夠基于用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置訓(xùn)練出機器學(xué)習(xí)模型。
根據(jù)本發(fā)明的示例性實施例,提供一種用于訓(xùn)練機器學(xué)習(xí)模型的方法,包括:獲取用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置;以及使用針對機器學(xué)習(xí)模型的模型訓(xùn)練框架對獲取的配置進行解析,并執(zhí)行解析得到的用于訓(xùn)練機器學(xué)習(xí)模型的處理邏輯,以訓(xùn)練出機器學(xué)習(xí)模型,其中,用于限定機器學(xué)習(xí)模型的訓(xùn)練過程的配置包括以下配置之中的至少一種:算法配置,用于限定用于訓(xùn)練機器學(xué)習(xí)模型的機器學(xué)習(xí)算法的運算邏輯;輸入配置,用于限定所述機器學(xué)習(xí)算法的輸入數(shù)據(jù);參數(shù)配置,用于限定機器學(xué)習(xí)模型的參數(shù);以及環(huán)境配置,用于限定訓(xùn)練機器學(xué)習(xí)模型時的環(huán)境。
可選地,算法配置用于限定表示所述機器學(xué)習(xí)算法的運算邏輯的計算圖的配置;和/或,輸入配置用于限定從原始輸入數(shù)據(jù)生成所述機器學(xué)習(xí)算法的輸入數(shù)據(jù)的方式;和/或,參數(shù)配置用于限定以下項之中的至少一項:機器學(xué)習(xí)模型的參數(shù)的初始值或初始值的生成方式、機器學(xué)習(xí)模型的參數(shù)的更新方式、機器學(xué)習(xí)模型的參數(shù)的數(shù)據(jù)類型;和/或,環(huán)境配置用于限定以下項之中的至少一項:原始輸入數(shù)據(jù)的存儲路徑、訓(xùn)練出的機器學(xué)習(xí)模型的參數(shù)的存儲路徑、執(zhí)行解析得到的處理邏輯所使用的運算線程數(shù)量、是否使用圖形處理器來執(zhí)行解析得到的處理邏輯、是否使用集群執(zhí)行解析得到的處理邏輯、執(zhí)行解析得到的處理邏輯所使用的集群。
可選地,用于訓(xùn)練機器學(xué)習(xí)模型的機器學(xué)習(xí)算法包括神經(jīng)網(wǎng)絡(luò)算法、邏輯回歸算法或決策樹算法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于第四范式(北京)技術(shù)有限公司,未經(jīng)第四范式(北京)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811041753.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





