[發明專利]一種在機器學習中調整模型參數的方法及裝置在審
| 申請號: | 201910588359.8 | 申請日: | 2019-07-01 |
| 公開(公告)號: | CN110298448A | 公開(公告)日: | 2019-10-01 |
| 發明(設計)人: | 龔俊衡;徐瑩 | 申請(專利權)人: | 成都品果科技有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 成都高遠知識產權代理事務所(普通合伙) 51222 | 代理人: | 曾克;施磊 |
| 地址: | 610000 四川省成都市*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡模型 模型參數 機器學習 數據標簽 數據類型 損失函數 模型參數訓練 參數調整 策略選取 工作效率 循環執行 訓練步驟 獎勵 收斂 查找 更新 優化 | ||
1.一種在機器學習中調整模型參數的方法,其特征在于,包括:
S1:獲取輸入數據;所述輸入數據中包括數據標簽;
S2:判斷所述數據標簽的數據類型;
S3:根據所述數據類型,選取待訓練的網絡模型,并選取用于優化所述網絡模型的損失函數;
S4:根據當前策略選取所述網絡模型的模型參數;
S5:采用所述模型參數訓練所述網絡模型,并根據所述損失函數計算損失值;將所述損失值作為當前策略的獎勵;
S6:根據所述獎勵更新當前策略,并循環執行步驟S4~S5,直至當前策略收斂。
2.根據權利要求1所述的在機器學習中調整模型參數的方法,其特征在于,所述數據類型包括:連續型,類別型;
當所述數據類型為連續型時,所述待訓練的網絡模型為回歸網絡模型,所述損失函數為回歸損失函數;
當所述數據類型為類別型時,所述待訓練的網絡模型為分類網絡模型,所述損失函數為分類損失函數。
3.根據權利要求1所述的在機器學習中調整模型參數的方法,其特征在于,判斷所述當前策略收斂的方法包括:
在循環執行步驟S4~S5的過程中,相鄰兩次所述獎勵不變。
4.一種在機器學習中調整模型參數的裝置,其特征在于,包括:
獲取單元,用于獲取輸入數據;所述輸入數據中包括數據標簽;
判斷單元,用于判斷所述數據標簽的數據類型;
第一選取單元,用于根據所述數據類型,選取待訓練的網絡模型,并選取用于優化所述網絡模型的損失函數;
第二選取單元,用于根據當前策略選取所述網絡模型的模型參數;
模型訓練單元,用于采用所述模型參數訓練所述網絡模型,并根據所述損失函數計算損失值;將所述損失值作為當前策略的獎勵;
更新單元,用于根據所述獎勵更新當前策略;
所述更新單元、所述第二選取單元、所述模型訓練單元依次循環地進行參數傳遞,直至當前策略收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都品果科技有限公司,未經成都品果科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910588359.8/1.html,轉載請聲明來源鉆瓜專利網。





