[發(fā)明專利]執(zhí)行機(jī)器學(xué)習(xí)流程的方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201611113470.4 | 申請日: | 2016-12-06 |
| 公開(公告)號: | CN106779088B | 公開(公告)日: | 2019-04-23 |
| 發(fā)明(設(shè)計)人: | 欒淑君;楊慧斌;孫迪 | 申請(專利權(quán))人: | 第四范式(北京)技術(shù)有限公司 |
| 主分類號: | G06N99/00 | 分類號: | G06N99/00;G06F3/0484;G06F16/904 |
| 代理公司: | 北京銘碩知識產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 曾世驍 |
| 地址: | 100085 北京市海淀區(qū)上*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 執(zhí)行 機(jī)器 學(xué)習(xí) 流程 方法 系統(tǒng) | ||
提供了一種執(zhí)行機(jī)器學(xué)習(xí)流程的方法及系統(tǒng),所述方法包括:(A)向用戶展示用于配置機(jī)器學(xué)習(xí)任務(wù)的圖形界面并檢測用戶通過圖形界面執(zhí)行的輸入操作,其中,機(jī)器學(xué)習(xí)任務(wù)用于執(zhí)行機(jī)器學(xué)習(xí)流程所包括的數(shù)據(jù)處理;(B)根據(jù)檢測到的用戶通過所述圖形界面執(zhí)行的輸入操作來配置所述機(jī)器學(xué)習(xí)任務(wù);以及(C)在不執(zhí)行配置的所述機(jī)器學(xué)習(xí)任務(wù)的情況下,推斷與所述機(jī)器學(xué)習(xí)任務(wù)有關(guān)的數(shù)據(jù)屬性信息,其中,數(shù)據(jù)屬性信息包括數(shù)據(jù)屬性字段的名稱和/或數(shù)據(jù)類型。相應(yīng)地,能夠花費(fèi)較少資源和時間而有效地得到機(jī)器學(xué)習(xí)流程中各個階段的數(shù)據(jù)屬性信息,從而改善機(jī)器學(xué)習(xí)工具的可操作性。
技術(shù)領(lǐng)域
本發(fā)明總體說來涉及人工智能領(lǐng)域,更具體地說,涉及一種執(zhí)行機(jī)器學(xué)習(xí)流程的方法及系統(tǒng)。
背景技術(shù)
隨著海量數(shù)據(jù)的出現(xiàn),人工智能技術(shù)得到了迅速發(fā)展,其中,機(jī)器學(xué)習(xí)技術(shù)普遍被用于從海量的數(shù)據(jù)記錄(例如,金融數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)等)中挖掘出有益的價值,
然而,人工智能技術(shù)應(yīng)用的一大難題在于缺少有效易用的機(jī)器學(xué)習(xí)工具,很多現(xiàn)有的機(jī)器學(xué)習(xí)平臺都僅面向精通機(jī)器學(xué)習(xí)技術(shù)的使用者,并且,由于機(jī)器學(xué)習(xí)往往所針對的是海量復(fù)雜數(shù)據(jù)和復(fù)雜數(shù)據(jù)運(yùn)算,因此,即便是精通機(jī)器學(xué)習(xí)技術(shù)的使用者也難以有效地操作目前的機(jī)器學(xué)習(xí)工具。實際上,要想培養(yǎng)出精通機(jī)器學(xué)習(xí)的技術(shù)專家,需要花費(fèi)大量的時間和精力,這使得人工智能技術(shù)的應(yīng)用存在較高的人才門檻。另一方面,機(jī)器學(xué)習(xí)模型的預(yù)測效果與模型的選擇、可用的數(shù)據(jù)和特征的提取等都有關(guān)系,例如,在確定特征提取方式的過程中,往往不僅需要掌握機(jī)器學(xué)習(xí)的技術(shù)知識,還需要對實際預(yù)測問題有深入的理解,而預(yù)測問題往往結(jié)合著不同行業(yè)的不同實踐經(jīng)驗,導(dǎo)致很難僅依靠技術(shù)專家來達(dá)到滿意的機(jī)器學(xué)習(xí)效果。可以看出,機(jī)器學(xué)習(xí)工具需要在操作性上有所改進(jìn),以幫助不同用戶更好地執(zhí)行機(jī)器學(xué)習(xí)流程。
作為示例,Azure Machine Learning(簡稱“AML”)是微軟在其公有云Azure上推出的基于Web使用的一項機(jī)器學(xué)習(xí)服務(wù),該產(chǎn)品的目標(biāo)是簡化使用機(jī)器學(xué)習(xí)的過程,以便于開發(fā)人員、業(yè)務(wù)分析師和數(shù)據(jù)科學(xué)家進(jìn)行廣泛、便捷地應(yīng)用。
在AML中,用戶可通過DAG(有向無環(huán)圖)來完成機(jī)器學(xué)習(xí)流程中各個機(jī)器學(xué)習(xí)任務(wù)(例如,數(shù)據(jù)導(dǎo)入、數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)變換、特征抽取、模型訓(xùn)練等)的配置,其中,在用戶選擇運(yùn)行DAG中的特定頂點之后,該頂點所代表的機(jī)器學(xué)習(xí)任務(wù)將被執(zhí)行,并且,作為執(zhí)行結(jié)果而得到的數(shù)據(jù)的字段名稱被顯示在屏幕上。
具體說來,參照圖1A,在AML中建立的機(jī)器學(xué)習(xí)流程可包括諸如成人調(diào)查收入表的導(dǎo)入(Adult Census Income Binary)、選擇數(shù)據(jù)集中的列(Select Columns in Dataset)和清理丟失數(shù)據(jù)(Clean Missing Data)等機(jī)器學(xué)習(xí)任務(wù),其中,在完成了對“選擇數(shù)據(jù)集中的列”的配置之后,可開始配置下游機(jī)器學(xué)習(xí)任務(wù)“清理丟失數(shù)據(jù)”。
然而,如圖1B中所示,由于之前的“選擇數(shù)據(jù)集中的列”這一任務(wù)沒有執(zhí)行,所以無法按照字段名稱來配置“清理丟失數(shù)據(jù)”,相應(yīng)地,在屏幕上顯示了提醒消息“將在執(zhí)行實驗之后啟用基于名稱的列選擇(Name-based column selection will be enabled afterrunning the experiment)”。
在圖1C中,可以看出,通過點擊屏幕下方的“RUN”而實際執(zhí)行了機(jī)器學(xué)習(xí)任務(wù)“選擇數(shù)據(jù)集中的列”。相應(yīng)地,在圖1D中,下游機(jī)器學(xué)習(xí)任務(wù)“清理丟失數(shù)據(jù)”變得能夠基于名稱來進(jìn)行相應(yīng)的配置。
可以看出,在AML中,在配置機(jī)器學(xué)習(xí)流程的過程中,用戶無法預(yù)先了解到任何關(guān)于經(jīng)過各個機(jī)器學(xué)習(xí)任務(wù)處理后所得到的數(shù)據(jù)字段的信息,只有在相應(yīng)機(jī)器學(xué)習(xí)任務(wù)被實際執(zhí)行之后,才能知曉結(jié)果數(shù)據(jù)的字段名稱。然而,由于機(jī)器學(xué)習(xí)過程常常涉及海量數(shù)據(jù),執(zhí)行機(jī)器學(xué)習(xí)任務(wù)將花費(fèi)大量的時間和計算資源,這使得無法及時有效地獲取或利用各階段的數(shù)據(jù)屬性信息。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于第四范式(北京)技術(shù)有限公司,未經(jīng)第四范式(北京)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611113470.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 以注射方式執(zhí)行死刑的自動執(zhí)行車的執(zhí)行床
- 過程執(zhí)行裝置、過程執(zhí)行方法以及過程執(zhí)行程序
- 用以執(zhí)行跳舞電子游戲的執(zhí)行系統(tǒng)及其執(zhí)行方法
- 策略執(zhí)行系統(tǒng)及其執(zhí)行方法
- 腳本執(zhí)行系統(tǒng)和腳本執(zhí)行方法
- 命令執(zhí)行設(shè)備、命令執(zhí)行系統(tǒng)、命令執(zhí)行方法以及命令執(zhí)行程序
- 程序執(zhí)行裝置、程序執(zhí)行系統(tǒng)以及程序執(zhí)行方法
- 處理執(zhí)行設(shè)備和由該處理執(zhí)行設(shè)備執(zhí)行的方法
- 有序任務(wù)的執(zhí)行方法、執(zhí)行裝置和執(zhí)行系統(tǒng)
- 執(zhí)行器(閥門執(zhí)行器)
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





