[發明專利]使用超參數預測器提高自動機器學習模型選擇的準確度在審
| 申請號: | 202080038456.0 | 申請日: | 2020-04-02 |
| 公開(公告)號: | CN114008641A | 公開(公告)日: | 2022-02-01 |
| 發明(設計)人: | H·F·莫漢達姆;S·阿格爾沃;V·瓦拉達拉珍;A·雅科夫列夫;S·伊蒂庫拉;N·阿格爾沃 | 申請(專利權)人: | 甲骨文國際公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20;G06N3/04;G06N3/08;G06N5/00 |
| 代理公司: | 中國貿促會專利商標事務所有限公司 11038 | 代理人: | 羅亞男 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 使用 參數 預測 提高 自動 機器 學習 模型 選擇 準確度 | ||
1.一種方法,包括:
對于多個微型機器學習模型(MML模型)中的每個MML模型,
訓練預測相應的預測超參數設置集的相應超參數預測器集,其中所述每個MML模型表示相應的參考機器學習算法(RML),其中為所述每個MML模型訓練所述相應的超參數預測器集包括:
生成用于訓練所述相應的超參數預測器集的第一訓練數據,其中生成第一訓練數據包括:
從第一數據集生成第一多個數據集樣本;
生成第一多個第一元特征集,所述第一多個第一元特征集中的每個第一元特征集描述所述第一多個數據集樣本中的相應第一數據集樣本;
使用超調算法為所述每個MML模型生成相應的超參數設置目標集。
2.如權利要求1所述的方法,其中訓練所述相應的超參數預測器集包括:使用所述第一多個第一元特征集和所述相應的超參數設置目標集來訓練所述相應的超參數預測器集。
3.如權利要求1所述的方法,還包括:
通過至少以下方式訓練所述多個MML模型中的每個MML模型,從而生成多個經訓練的MML模型中的所述每個MML模型的相應經訓練的版本和相應分數:
從所述第一數據集生成第二多個數據集樣本;
生成第二多個第二元特征集,所述第二多個第二元特征集中的第二第一元特征集描述所述第二多個數據集樣本中的相應第二數據集樣本;
通過將所述每個經訓練的MML模型的相應的超參數預測器集應用于所述第二多個第二元特征集,生成相應的預測超參數設置。
4.如權利要求3所述的方法,還包括:
通過以下方式訓練所述多個經訓練的MML模型中的所述每個經訓練的MML模型的相應參考RML預測器:
使用所述第二多個第二元特征集和所述每個經訓練的MML模型的所述相應分數作為訓練輸入;
使用由所述超調算法在所述第一數據集上生成的分數作為目標。
5.如權利要求4所述的方法,其中訓練所述每個經訓練的MML模型的相應的參考RML預測器生成多個經訓練的RML預測器的相應的經訓練的RML預測器。
6.如權利要求5所述的方法,還包括:
從所述第一數據集生成第三多個數據集樣本;
生成第三多個第三元特征集,每個第三元特征集描述所述第三多個數據集樣本中的相應第三數據集樣本;
通過以下方式為所述多個經訓練的MML模型的所述每個經訓練的MML模型的每個相應的經訓練的RML預測器生成多個RML預測器分數:
針對每個第三數據集樣本,使用所述相應的第三元特征集和所述每個經訓練的MML模型的所述相應分數生成RML預測器分數。
7.如權利要求6所述的方法,還包括:
基于所述多個RML預測器分數選擇多個機器學習算法中的一個或多個機器學習算法,其中每個機器學習算法與所述多個MML模型中的一個MML模型相關聯;
基于第一數據集調用相應的RML模型以獲得結果。
8.如權利要求7所述的方法,其中選擇所述一個或多個機器學習算法包括基于所述多個RML預測器分數對所述多個機器學習算法進行排名。
9.如權利要求7所述的方法,其中所述多個機器學習算法中的每個機器學習算法包括以下中的至少一個:支持向量機(SVM)、隨機森林、決策樹或人工神經網絡。
10.如權利要求7所述的方法,其中所述多個機器學習算法中的每個機器學習算法包括以下中的一個:分類、回歸或異常檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于甲骨文國際公司,未經甲骨文國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202080038456.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抗TDP-43結合分子及其用途
- 下一篇:用于熱塑性廢料的蒸發的回轉窯





