[發明專利]一種機器學習模型的編碼解碼方法與裝置有效
| 申請號: | 201811293226.X | 申請日: | 2018-11-01 |
| 公開(公告)號: | CN109472366B | 公開(公告)日: | 2020-07-24 |
| 發明(設計)人: | 劉紅麗;李峰;劉宏剛 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 機器 學習 模型 編碼 解碼 方法 裝置 | ||
本發明公開了一種機器學習模型的編碼解碼方法與裝置,包括:采集原始數據并對原始數據進行抽樣;使用模型生成器將原始數據編碼為模型編碼;使用模型解碼器將模型編碼的抽樣結果解碼為有效模型;使用原始數據訓練有效模型。本發明的技術方案能夠針對不同機器學習模型或不同類型的機器學習模型進行編碼解碼,降低計算復雜度,快速生成機器學習模型。
技術領域
本發明涉及機器學習領域,并且更具體地,特別是涉及一種機器學習模型的編碼解碼方法與裝置。
背景技術
目前機器學習的應用并不廣泛。首先,建模過程繁瑣。算法建模及調參是一個非常繁瑣的過程,需要數據預處理、特征工程、模型調參、模型評估等環節不斷循環反復才能完成復雜的建模過程,一個3-6人的數據建模團隊通常需要花費數月時間才能完成復雜的建模。其次,人工智能人才匱乏。機器學習涉及大量的工程和算法,依賴科學家的資源,然而目前中國人工智能的人才缺口超過500萬,供求比例僅為1:10,并且人工智能專業人才普遍薪水較高,帶來了巨大的人力成本。再次,算法設計周期長。一個互聯網公司典型的人工智能項目開發需要30人·月,傳統行業需要花費更多的人力和時間。最后,系統實施維護困難。生產環境不斷發生變化,模型準確度下降,數據管理困難,算法模型更新周期長。
一種推廣機器學習的方式是使用AutoML。AutoML使用了Google的learn2learn和轉移學習等先進技術,幫助那些只有有限機器學習知識的企業構建高品質的自定義模型。AutoML也將使AI(人工智能)專家們更加高效地工作,拓展新的AI領域,并幫助那些技術嫻熟的工程師構建強大的AI系統,這也是AI研究人員一直以來所追求的目標。將訓練數據集傳入后,AutoML會自動形成訓練模型,這樣即使不具備機器學習方面深入的專業知識也可以進行機器學習方面的工作。
由于AutoML的本質工作是將各個過程的方法進行選擇、組合、優化,所以存在如下問題:我們通常并不知道所優化的參數和預期效果之間是什么樣的顯示表達,所以目標函數形式未知;可能的組合方式太多,所以搜索空間巨大;組合方式太多,而且每一個組合都需要從頭做數據預處理、特征處理、模型訓練等操作,所以函數計算代價巨大。
針對現有技術中的建立模型的計算復雜度過大,難以實現的問題,目前尚未有有效的解決方案。
發明內容
有鑒于此,本發明實施例的目的在于提出一種機器學習模型的編碼解碼方法與裝置,能夠針對不同機器學習模型或不同類型的機器學習模型進行編碼解碼,降低計算復雜度,快速生成機器學習模型。
基于上述目的,本發明實施例的一方面提供了一種機器學習模型的編碼解碼方法,包括以下步驟:
采集原始數據并對原始數據進行抽樣;
使用模型生成器將原始數據的抽樣結果編碼為模型編碼;
使用模型解碼器將模型編碼解碼為有效模型;
使用原始數據訓練有效模型。
在一些實施方式中,將模型編碼解碼為有效模型包括:
對模型編碼使用cell結構搜索,生成第一編碼結果;
根據原始數據對第一編碼結果使用nasnet結構搜索,生成第二編碼結果;
解碼第二編碼結果獲得有效模型。
在一些實施方式中,第一編碼結果和第二編碼結果均為搜索空間矩陣。
在一些實施方式中,cell結構包括通常cell和規約cell,每個cell包括多個數據塊,每個數據塊各自包括約束條件信息、深度學習操作信息、和拼接操作信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811293226.X/2.html,轉載請聲明來源鉆瓜專利網。





