[發明專利]用于自動機器學習模型選擇的特定于算法的神經網絡體系架構在審
| 申請號: | 201880062950.3 | 申請日: | 2018-09-28 |
| 公開(公告)號: | CN111164620A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | S·阿格爾沃;S·伊蒂庫拉;V·瓦拉達拉珍;N·阿格爾沃 | 申請(專利權)人: | 甲骨文國際公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20 |
| 代理公司: | 中國國際貿易促進委員會專利商標事務所 11038 | 代理人: | 周衡威 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 自動 機器 學習 模型 選擇 定于 算法 神經網絡 體系 架構 | ||
1.一種方法,包括:
通過對于多個元特征中的每個元特征從推理數據集中導出相應的元特征值,來從推理數據集中導出多個元特征值;
對于多個可訓練的算法中的每個算法:
對于分別與該算法相關聯的多個回歸元模型中的每個元模型,通過基于以下各項中的至少一項調用該元模型來計算相應的分數:
a)所述多個元特征值的相應的元特征值的子集,或b)所述算法的多個超參數的相應子集的超參數值;
基于所述相應的分數從所述多個可訓練的算法中選擇一個或多個算法;
基于所述推理數據集,調用所述一個或多個算法以獲得結果。
2.如權利要求1所述的方法,其中:
所述一個或多個算法包括多個算法;
選擇所述一個或多個算法包括基于所述相應的分數對所述多個可訓練的算法進行排名。
3.如權利要求1所述的方法,其中,所述超參數值是默認值。
4.如權利要求1所述的方法,其中:
所述多個可訓練的算法中的每個算法與相應的集合體相關聯,該相應的集合體包含與該算法相關聯的所述多個回歸元模型;
所述方法還包括:對于所述多個可訓練的算法中的每個算法,導出相應的集合體分數,該相應的集合體分數基于與該算法相關聯的所述多個回歸元模型的所述相應的分數;
基于所述相應的分數選擇所述一個或多個算法包括:基于所述相應的集合體分數選擇所述一個或多個算法。
5.如權利要求1所述的方法,還包括:
存儲多個測試數據集;
對于所述多個可訓練的算法中的每個算法:
對于基于所述算法的多個模型中的每個模型:
基于所述算法的所述多個超參數的相應特定值來配置所述模型;以及
對于所述多個測試數據集中的每個測試數據集:
基于所述測試數據集測試所述模型以計算相應的測試分數;以及
記錄不同元組,所述不同元組引用:所述多個超參數的所述相應特定值、所述測試數據集、所述相應的測試分數和所述算法;以及
對于與所述算法相關聯的所述多個回歸元模型中的每個元模型,基于為所述算法記錄的所述不同元組中的至少一個元組來訓練所述元模型。
6.如權利要求5所述的方法,其中,至少以下之一:
所述多個元特征排除缺失所述不同元組的超過閾值的百分比的值的元特征,或者
所述不同元組中的所述至少一個元組排除缺失值的元組。
7.如權利要求5所述的方法,還包括利用原始訓練數據集交叉驗證所述多個模型,所述原始訓練數據集被劃分為:多個訓練數據集和所述多個測試數據集。
8.如權利要求5所述的方法,還包括并行地生成所述不同元組中的多個元組。
9.如權利要求1所述的方法,其中,所述多個可訓練的算法中的每個算法包括以下之一:支持向量機(SVM)、隨機森林、決策樹或人工神經網絡。
10.如權利要求1所述的方法,其中,所述多個可訓練的算法中的每個算法包括以下之一:分類、回歸或異常檢測。
11.如權利要求1所述的方法,其中,所述多個回歸元模型中的每個元模型包括不同的人工神經網絡。
12.如權利要求1所述的方法,其中,計算所述相應的分數包括softmax函數。
13.如權利要求1所述的方法,還包括通過獨熱或獨冷中的至少一個編碼方案來轉換所述多個元特征中的非數值型元特征的值。
14.如權利要求1所述的方法,還包括通過零均值或單位方差中的至少一個編碼方案來轉換所述多個元特征中的數值型元特征的值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于甲骨文國際公司,未經甲骨文國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880062950.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:包裝體以及薄膜
- 下一篇:基于服務能力要求和偏好的服務注冊





