[發明專利]基于遺傳算法的自動機器學習數據建模方法在審
| 申請號: | 202010972405.7 | 申請日: | 2020-09-16 |
| 公開(公告)號: | CN112070237A | 公開(公告)日: | 2020-12-11 |
| 發明(設計)人: | 董俊杰;王之元 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06N3/12 |
| 代理公司: | 蘇州拓云知識產權代理事務所(普通合伙) 32344 | 代理人: | 李鋒 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遺傳 算法 自動 機器 學習 數據 建模 方法 | ||
1.基于遺傳算法的自動機器學習數據建模方法,其特征在于,其包括以下步驟:
步驟一:設定多個管道,每個所述管道均包含四個模塊,四個所述模塊分別設置為數據預處理模塊、特征工程模塊、模型生成模塊和模型評估模塊;
步驟二:初始化遺傳算法,首先定義遺傳算法的關鍵參數:generations,population_size,offspring_size,mutation_rate,crossover_rate,然后定義優化參數:scoring,cv,subsample;
步驟三:遺傳算法過程:
a.初始化:隨機初始化n個線性管道;
b.淘汰:通過多目標遺傳規劃算法選擇,最大化驗證集準確率同時最小化每個管道的算子,選取定義的前d個管道;
c.分裂:將步驟2得到的d個管道復制t份共d*t個管道作為初始化子代;
d.變異:首先將5%子代與另5%子代的管道上的算子互換,然后將剩下的90%的子代,等概率進行增刪,轉移算子操作;
e.轉到步驟二,重復該過程m次;
步驟四:將最優的管道生成的模型保存同時保存了最優參數,以便用于模型部署。
2.根據權利要求1所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述步驟一中,所述數據預處理模塊包括數據增強、缺失值計算、數據變換、數據集分割和數據標準化與歸一化方法。
3.根據權利要求1所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述步驟一中,特征工程模塊主要為特征選擇,主要包括過濾式、包裹式和嵌入式。
4.根據權利要求3所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述過濾式有方差選擇法、相關系數法、卡方檢驗和互信息法。
5.根據權利要求3所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述包裹式主要為遞歸特征消除法。
6.根據權利要求3所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述嵌入式主要由基于懲罰項的特征選擇法、基于樹模型的特征選擇法。
7.根據權利要求2所述的基于遺傳算法的自動機器學習數據建模方法,其特征在于:所述步驟二中,所述generations表示遺傳算法進化次數,可理解為迭代次數;所述population_size表示每次進化中種群的大小;所述scoring表示損失函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010972405.7/1.html,轉載請聲明來源鉆瓜專利網。





