[發明專利]自動集成機器學習的方法、裝置、介質及電子設備在審
| 申請號: | 202010982700.0 | 申請日: | 2020-09-17 |
| 公開(公告)號: | CN112116104A | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 夏曉華;王美青;呂軍;程建波 | 申請(專利權)人: | 京東數字科技控股股份有限公司 |
| 主分類號: | G06N20/20 | 分類號: | G06N20/20 |
| 代理公司: | 北京律智知識產權代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 100176 北京市大興區北京經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動 集成 機器 學習 方法 裝置 介質 電子設備 | ||
本發明實施例提供了一種自動集成機器學習的方法、裝置、介質和電子設備,所述方法包括:步驟S1:獲取預配置的至少兩個機器學習模型、超參數搜索空間、集成算法以及集成算法參數組;步驟S2:將在超參數搜索空間的范圍內選擇的第一超參數輸入到各個所述機器學習模型中;步驟S3:根據所述集成算法以及第一集成算法參數將所述至少兩個機器學習模型進行集成,生成第一集成模型;步驟S4:對所述第一集成模型進行訓練和模型評分,得到評分結果;步驟S5:以依次執行的步驟S2、步驟S3、步驟S4作為一個循環,在重復執行所述循環后,根據各個所述循環的評分結果確定目標集成模型。本發明實施例的技術方案可以得到整體較優的集成模型。
技術領域
本發明涉及計算機技術領域,具體而言,涉及一種自動集成機器學習的方法、裝置、計算機可讀存儲介質及電子設備。
背景技術
機器學習(Machine Learning)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。機器學習專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。機器學習是人工智能的核心,是使計算機具有智能的根本途徑,因而也越來越廣泛地被用于各種業務場景。
通過對業務數據的加工處理、特征的加工和選擇以及模型選擇和參數的調整,可以獲取最優的機器學習模型。這個過程包括了大量重復性和經驗性的勞動。
自動機器學習技術通過自動特征工程、自動選模、自動調參優化等手段來自動生成機器學習模型,減輕算法人員的勞動量。
為了提高機器學習模型的效果,從準確率、精準度、召回率等多方面評價模型,可以采用集成學習等方法來對多個模型進行集成從而得到效果評分更高的集成模型。
集成學習是一種使用多種兼容的學習算法/模型來執行單個任務的技術,目的是為了得到更佳的預測表現。
現有技術一般是通過自動機器學習來對單個模型進行超參數的優化。而集成學習一般是在對基礎模型進行優化后再進行集成學習,并且集成學習的參數也需要調整優化。在對單個模型進行超參數優化和對集成學習進行參數優化的過程按先后順序串聯進行時,實際是進行了分階段調優的優化,所得到的最終模型雖然在各個階段進行了調優,但最終整體模型不一定是最優模型。
需要說明的是,在上述背景技術部分公開的信息僅用于加強對本發明的背景的理解,因此可以包括不構成對本領域普通技術人員已知的現有技術的信息。
發明內容
本發明實施例的目的在于提供一種自動集成機器學習的方法、裝置、計算機可讀存儲介質及電子設備,進而至少在一定程度上得到整體較優的集成模型。
本發明的其他特性和優點將通過下面的詳細描述變得顯然,或部分地通過本發明的實踐而習得。
根據本發明實施例的第一方面,提供一種自動集成機器學習的方法,該方法包括:步驟S1:獲取預配置的至少兩個機器學習模型、各個所述機器學習模型的超參數搜索空間、集成算法以及所述集成算法的集成算法參數組,其中,所述集成算法參數組包括至少一個集成算法參數;步驟S2:將在所述超參數搜索空間的范圍內選擇的第一超參數輸入到各個所述機器學習模型中;步驟S3:根據所述集成算法以及所述集成算法參數組中的第一集成算法參數將所述至少兩個機器學習模型進行集成,生成第一集成模型;步驟S4:對所述第一集成模型進行訓練和模型評分,得到評分結果;步驟S5:以依次執行的步驟S2、步驟S3、步驟S4作為一個循環,在重復執行N個所述循環后,根據各個所述循環的評分結果確定目標集成模型,其中,N為正整數。
在一些實施例中,所述步驟S2包括:根據以下任一種集成算法將所述至少兩個機器學習模型進行集成:堆疊集成算法、裝袋集成算法和提升集成算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東數字科技控股股份有限公司,未經京東數字科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010982700.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種嬰童多層紗布面料及其生產工藝
- 下一篇:新型室內空間集成化裝配式龍骨系統





