[發明專利]模型訓練、圖像處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 201911097179.6 | 申請日: | 2019-11-11 |
| 公開(公告)號: | CN110942090A | 公開(公告)日: | 2020-03-31 |
| 發明(設計)人: | 劉澤春 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100086 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 圖像 處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種模型訓練方法,其特征在于,所述方法包括:
獲取預設初始網絡模型和目標限定條件,其中,所述預設初始網絡模型包括初始網絡結構超參數和初始常規參數;
在所述目標限定條件下,基于預設交替更新方式、所述初始網絡結構超參數和所述初始常規參數,進行網絡模型的網絡結構超參數和常規參數迭代更新,直至網絡模型的網絡結構超參數和常規參數均收斂,得到目標網絡模型;
其中,所述預設交替更新方式包括:每進行S次常規參數的迭代更新,基于預設進化策略進行T次網絡結構超參數的迭代更新,T<S,所述目標網絡模型包括目標網絡結構超參數和目標常規參數。
2.根據權利要求1所述的方法,其特征在于,所述網絡結構超參數的更新過程,包括:
提取所述預設初始網絡模型的初始網絡結構超參數a1、a2,…,aN,其中,ai為所述預設初始網絡模型中的第i個初始網絡結構超參數,1≤i≤N,N為所述預設初始網絡模型中初始網絡結構超參數的個數;
基于所述a1、a2,…,aN,生成網絡結構超參數向量p,其中,p=(a1,a2,…,aN);
基于所述p,生成用于更新網絡結構超參數的方向導數gP,其中,loss為預設損失函數,△p為擾動量;
獲取擾動量集合{△p1,△p2,…,△pM},其中,△pj為所述擾動量集合中的第j個擾動量,1≤j≤M,M為所述擾動量集合中擾動量的個數;
基于所述{△p1,△p2,…,△pM}和所述gP,生成方向導數集合{gP1,gP2,…,gPM},其中,gPj為所述方向導數集合中的第j個方向導數;
基于預設梯度下降算法對所述{gP1,gP2,…,gPM}進行處理,得到所述p相對于所述{△p1,△p2,…,△pM}的更新方向集合{D1,D2,…,DM},其中,Dj為所述p相對于所述△pj的更新方向;
基于所述{D1,D2,…,DM},確定目標網絡結構超參數。
3.根據權利要求2所述的方法,其特征在于,所述基于所述{D1,D2,…,DM},確定目標網絡結構超參數,包括:
確定所述{D1,D2,…,DM}中滿足預設條件的更新方向;
計算所述滿足預設條件的更新方向所對應的網絡結構超參數的均值,并將所述均值確定為目標網絡結構超參數。
4.根據權利要求1所述的方法,其特征在于,所述網絡結構超參數包括:網絡模型中每層的輸出通道數、網絡模型的輸入圖像的分辨率和網絡模型的網絡深度。
5.根據權利要求1所述的方法,其特征在于,所述目標限定條件包括下述任一項:
網絡模型的總參數量低于預設數量閾值、網絡模型的總計算量低于預設計算量閾值,以及網絡模型在特定設備上的運行時長低于預設時長閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911097179.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種小型燃氣發生器工作壓強測試裝置
- 下一篇:一種電動三輪車電機外殼密封結構
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





