[發明專利]模型參數的處理方法、裝置、設備和計算機存儲介質有效
| 申請號: | 201711123787.0 | 申請日: | 2017-11-14 |
| 公開(公告)號: | CN109800884B | 公開(公告)日: | 2023-05-26 |
| 發明(設計)人: | 楊旭 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 廣州鑄智知識產權代理有限公司 44886 | 代理人: | 徐瑞紅 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 參數 處理 方法 裝置 設備 計算機 存儲 介質 | ||
本發明提供了一種模型參數的處理方法、裝置、設備和計算機存儲介質,其中方法包括:獲取用戶建立的學習模型以及訓練數據;確定所述學習模型的目標函數,迭代計算出基準參數候選集合;以所述候選集合中的基準參數取值以及所述訓練數據,對所述學習模型進行訓練,確定模型對應的訓練結果;將訓練結果滿足預設條件的模型對應的基準參數作為所述學習模型的參數。本發明能夠實現諸如邏輯回歸模型等學習模型的參數自動調整。
【技術領域】
本發明涉及計算機應用技術領域,特別涉及一種模型參數的處理方法、裝置、設備和計算機存儲介質。
【背景技術】
在機器學習平臺等應用場景下,用戶在進行模型建立中,一般需要用戶來進行模型參數的設定。例如,邏輯回歸模型是一種常用的二分類模型,常常被用于諸如判別一筆交易是否存在欺詐行為,電子郵件是否為垃圾郵件,用戶性別是男是女等。在邏輯回歸模型的訓練過程中,參數調整的好壞會嚴重影響到模型的預測效果;目前的參數調整主要由人工完成,例如在模型訓練的界面提供各種參數的輸入框以便人工填寫,因此對于調參人員需要有很好的要求,例如對模型原理熟悉,知道各參數的意義,具有一定的經驗,等等,這樣才能夠給出靠譜的參數初始值。
【發明內容】
有鑒于此,本發明提供了一種模型參數的處理方法、裝置、設備和計算機存儲介質,從而實現參數的自動調整。
具體技術方案如下:
本發明提供了一種機器學習平臺中模型參數的處理方法,該方法包括:
獲取用戶建立的學習模型以及訓練數據;
確定所述學習模型的目標函數,迭代計算出基準參數候選集合;
以所述候選集合中的基準參數取值以及所述訓練數據,對所述學習模型進行訓練,確定模型對應的訓練結果;
將訓練結果滿足預設條件的模型對應的基準參數作為所述學習模型的參數。
根據本發明一具體實施方式,該方法還包括:
將所述學習模型的參數展示給用戶,以便用戶進行編輯處理。
根據本發明一具體實施方式,所述學習模型包括邏輯回歸模型;
所述基準參數候選集合包括基準超參數。
根據本發明一具體實施方式,所述確定所述學習模型的目標函數,迭代計算出基準參數候選集合包括:
以所述學習模型的損失函數作為目標函數,迭代計算所述學習模型的參數的第一取值;
利用所述學習模型的參數的第一取值確定基準參數;
利用所述基準參數構造基準參數候選集合。
本發明提供了一種邏輯回歸模型的參數調整方法,該方法包括:
以邏輯回歸模型的損失函數作為目標函數,確定模型參數的第一取值;
將利用所述模型參數的第一取值確定出的超參數作為基準超參數;
利用基準超參數構造超參數候選集合;
分別針對所述超參數候選集合中的各超參數取值執行以下處理:以該超參數取值構造結構風險函數;以該結構風險函數作為目標函數,確定模型參數的第二取值;以模型參數的第二取值預測驗證樣本集;
從得到的各模型參數的第二取值中,選擇對驗證樣本集的預測結果最優的模型參數的第二取值作為模型參數,確定對應的超參數取值。
根據本發明一優選實施方式,所述以邏輯回歸模型的損失函數作為目標函數,確定模型參數的第一取值包括:
初始化模型參數的取值和迭代次數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711123787.0/2.html,轉載請聲明來源鉆瓜專利網。





