[發明專利]一種超參數確定方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202110160308.2 | 申請日: | 2021-02-05 |
| 公開(公告)號: | CN112529211B | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 劉紫薇;宋輝;董井然;陳守志 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳翼盛智成知識產權事務所(普通合伙) 44300 | 代理人: | 劉自麗 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 參數 確定 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種超參數確定方法,其特征在于,應用于分布式集群中的超參數評估節點,包括:
獲取至少一個待訓練模型的超參數組,其中,所述待訓練模型屬于目標模型類型,所述超參數組包括至少一個維度的超參數,每個維度的超參數指示所述待訓練模型在每個維度下的模型結構特征;
將目標超參數組分配給所述分布式集群中的目標超參數評估節點,以使得所述分布式集群中的每個超參數評估節點分配有對應的目標超參數組;
將進行模型訓練所需的數據集同步至所述目標超參數評估節點,其中,所述數據集為通過所述分布式集群進行數據預處理后得到的數據集;
采用所述目標超參數組調整目標待訓練模型的模型結構,其中,所述目標待訓練模型為所述目標超參數組對應的待訓練模型;
基于所述數據集,通過所述目標超參數評估節點對調整后的目標待訓練模型進行模型訓練,得到訓練后模型;
對訓練后模型進行模型評估,以確定所述目標超參數組的目標超參數評估結果,得到每個超參數組的超參數評估結果;
基于所述超參數評估結果,從所述超參數組中選取所述目標模型類型的最優超參數組。
2.根據權利要求1所述的超參數確定方法,其特征在于,將進行模型訓練所需的數據集同步至所述目標超參數評估節點,包括:
獲取進行模型訓練所需的原始數據集;
利用分布式集群對所述原始數據集進行數據預處理,得到進行模型訓練所需的數據集;
將所述數據集同步至所述目標超參數評估節點。
3.根據權利要求2所述的超參數確定方法,其特征在于,利用分布式集群對所述原始數據集進行數據預處理,得到進行模型訓練所需的數據集,包括:
對所述原始數據集進行劃分,得到至少一個子原始數據集;
將目標子原始數據集分配給所述分布式集群中的目標數據處理節點,其中,所述分布式集群包括至少一個數據處理節點;
通過所述目標數據處理節點對所述目標子原始數據集進行數據預處理,以對所述原始數據集進行數據預處理,得到進行模型訓練所需的數據集。
4.根據權利要求1所述的超參數確定方法,其特征在于,對訓練后模型進行模型評估,以確定所述目標超參數組的目標超參數評估結果,得到每個超參數組的超參數評估結果,包括:
獲取進行模型評估所需的驗證集,其中,所述驗證集包括樣本數據、以及所述樣本數據的目標標簽;
通過所述訓練后模型對所述樣本數據進行預測,得到所述樣本數據的預測標簽;
基于所述目標標簽與所述預測標簽,對所述訓練后模型進行模型評估,以確定目標超參數組的目標超參數評估結果,得到每個超參數組的超參數評估結果。
5.根據權利要求4所述的超參數確定方法,其特征在于,基于所述目標標簽與所述預測標簽,對所述訓練后模型進行模型評估,以確定目標超參數組的目標超參數評估結果,包括:
確定評估所述訓練后模型的至少一項評估指標;
基于所述預測標簽與所述目標標簽,計算所述訓練后模型的各項評估指標值;
將所述評估指標值進行融合,得到融合后的評估指標值,以對所述訓練后模型進行模型評估,其中,所述融合后的評估指標值表征所述目標超參數組的目標超參數評估結果。
6.根據權利要求1所述的超參數確定方法,其特征在于,獲取至少一個待訓練模型的超參數組,包括:
確定所述目標模型類型的待采樣超參數,其中,所述待采樣超參數設置有對應的采樣范圍;
在所述采樣范圍內對所述待采樣超參數進行數據采樣,得到采樣后的候選超參數值;
對所述候選超參數值進行組合,得到至少一個待訓練模型的超參數組。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110160308.2/1.html,轉載請聲明來源鉆瓜專利網。





