[發明專利]執行自動機器學習過程的方法、裝置及設備在審
| 申請號: | 202010307807.5 | 申請日: | 2020-04-17 |
| 公開(公告)號: | CN111611240A | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 呂自薈;王昱森;岳凌;郭夏瑋;郭朕;張宇;谷宇晨 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/25;G06K9/62;G06N20/00 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 馬鐵良 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 執行 自動 機器 學習 過程 方法 裝置 設備 | ||
1.一種執行自動機器學習過程的方法,包括:
提供相互獨立的模型訓練算子和模型預測算子;
基于訓練數據,利用所述模型訓練算子來訓練機器學習模型;以及,
利用所述模型預測算子和訓練出的所述機器學習模型,針對預測數據提供預測服務。
2.根據權利要求1所述的方法,其中,所述方法還包括獲得所述模型訓練算子的步驟,包括:
根據編輯所述模型訓練算子的操作,提供編輯界面;
獲取通過所述編輯界面輸入的算子內容,其中,所述算子內容包括對輸入的訓練數據進行數據預處理的操作命令、針對數據預處理后的訓練數據進行特征工程的操作命令、及根據特征工程的結果進行模型訓練的操作命令;
封裝所述算子內容,得到所述模型訓練算子。
3.根據權利要求1所述的方法,其中,所述基于訓練數據,利用所述模型訓練算子來訓練機器學習模型,包括:
響應于針對所述模型訓練算子的觸發操作,提供進行關于模型訓練的配置的配置界面;
根據通過所述配置界面輸入的配置信息,對所述訓練數據進行數據預處理和特征工程處理,獲得訓練樣本;
利用至少一種模型訓練算法,基于所述訓練樣本來訓練出機器學習模型。
4.根據權利要求3所述的方法,其中,所述配置界面包括以下至少一個配置項:機器學習模型的輸入源配置項、機器學習模型的適用問題類型配置項、訓練機器學習模型的算法模式配置項、機器學習模型的優化目標配置項、及機器學習模型的預測目標字段的字段名配置項。
5.根據權利要求3所述的方法,其中,所述對所述訓練數據進行數據預處理包括以下各項之中的至少一項:
第一項,對所述訓練數據進行數據類型轉換;
第二項,對所述訓練數據進行采樣;
第三項,將所述訓練數據標注為有標簽數據和無標簽數據;
第四項,自動識別所述訓練數據的數據字段類型;
第五項,對所述訓練數據進行缺失值填充;
第六項,對所述訓練數據中的初始時間字段進行解析,獲得并添加新的時間字段,且刪除所述初始時間字段;
第七項,自動識別所述訓練數據中的非數值數據,并對所述非數值數據進行哈希處理。
6.根據權利要求3所述的方法,其中,所述對所述訓練數據進行數據預處理和特征工程處理,獲得訓練樣本,包括:
對進行所述預處理后的訓練數據進行采樣;
對進行所述采樣后的訓練數據進行前特征選擇,獲得基礎特征;
對所述基礎特征進行特征衍生,獲得衍生特征;
根據所述基礎特征和所述衍生特征,生成訓練樣本。
7.根據權利要求6所述的方法,其中,所述對進行所述采樣后的訓練數據進行前特征選擇,獲得基礎特征,包括:
提取進行所述采樣后的訓練數據中包括的所有屬性信息,其中,所述屬性信息用于形成特征;
獲取每一所述屬性信息的特征重要性值;
根據所述特征重要性值,獲得基礎特征。
8.一種執行自動機器學習過程的裝置,包括:
交互模塊,用于提供相互獨立的模型訓練算子和模型預測算子;
機器學習模型訓練模塊,用于基于保存的訓練數據,利用所述模型訓練算子來訓練機器學習模型;以及
數據預測模塊,用于利用所述模型預測算子和訓練出的所述機器學習模型,針對收集到的預測數據提供預測服務。
9.一種包括至少一個計算裝置和至少一個存儲裝置的設備,其中,所述至少一個存儲裝置用于存儲指令,所述指令用于控制所述至少一個計算裝置執行根據權利要求1至7中任一項所述的方法。
10.一種計算機可讀存儲介質,其中,其上存儲有計算機程序,所述計算機程序在被處理器執行時實現如權利要求1至7中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010307807.5/1.html,轉載請聲明來源鉆瓜專利網。





