[發明專利]基于算法集成平臺的模型處理方法、裝置和計算機設備在審
| 申請號: | 202010915750.7 | 申請日: | 2020-09-03 |
| 公開(公告)號: | CN114139696A | 公開(公告)日: | 2022-03-04 |
| 發明(設計)人: | 韓演 | 申請(專利權)人: | 順豐科技有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 方高明 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 算法 集成 平臺 模型 處理 方法 裝置 計算機 設備 | ||
本申請涉及一種基于算法集成平臺的模型處理方法、裝置和計算機設備。所述方法包括:獲取目標算法的配置文件;從算法集成平臺中調用訓練腳本對所述配置文件進行解析,得到解析結果;所述解析結果包括網絡結構數據和訓練超參數數據;基于所述算法集成平臺,根據所述網絡結構數據和訓練超參數數據生成待訓練的神經網絡模型;根據獲取的樣本數據集對所述神經網絡模型進行訓練,得到訓練好的目標神經網絡模型。采用本方法能夠提高神經神經網絡模型的訓練效率。
技術領域
本申請涉及深度學習技術領域,特別是涉及一種基于算法集成平臺的模型處理方法、裝置和計算機設備。
背景技術
目標檢測的目的是檢測中圖像中的物體,包括物體的位置以及物體的類別,但是因為物體的大小不一、背景復雜、形狀多變、堆疊等因素的影響,導致目標檢測是一個比較難的領域,也有很多研究學者們貢獻了很多優秀的算法,其中基于深度學習的目標檢測算法近幾年有了很重要的進展。目標識別也是深度學習的一塊重要的內容,主要目的是區分該張圖片所屬的類別,給圖片一個標簽。通常檢測算法和分類算法會同時使用,比如人臉識別需要先通過人臉檢測標注出人臉所在位置,在通過人臉識別進行人臉的特征提取。
然而,目前在根據檢測算法對特征檢測模型進行訓練,以及識別算法對特征識別模型進行訓練時,只能單獨獲取算法對對應的檢測模型進行訓練導致神經網絡模型訓練效率低。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高神經網絡模型訓練效率的基于算法集成平臺的模型處理方法、裝置、計算機設備和存儲介質。
一種基于算法集成平臺的模型處理方法,所述方法包括:
獲取目標算法的配置文件;
從算法集成平臺中調用訓練腳本對所述配置文件進行解析,得到解析結果;所述解析結果包括網絡結構數據和訓練超參數數據;
基于所述算法集成平臺,根據所述網絡結構數據和訓練超參數數據生成待訓練的神經網絡模型;
根據獲取的樣本數據集對所述神經網絡模型進行訓練,得到訓練好的目標神經網絡模型。
在其中一個實施例中,所述基于算法集成平臺,根據所述網絡結構數據和訓練超參數數據生成待訓練的神經網絡模型,包括:
根據所述網絡結構數據和訓練超參數數據從所述算法集成平臺中確定對應的特征提取網絡和結果輸出網絡;
根據所述特征提取網絡和結果輸出網絡生成待訓練的神經網絡模型。
在其中一個實施例中,所述解析結果包括樣本數據集路徑信息;所述根據獲取的樣本數據集對所述神經網絡模型進行訓練,得到訓練好的目標神經網絡模型,包括:
根據所述樣本數據集路徑信息獲取樣本數據集;所述樣本數據集包括訓練數據集和驗證數據集;
通過所述訓練數據集對所述神經網絡模型進行迭代訓練,更新所述神經網絡模型的權重和學習率;以及
通過所述驗證數據集對訓練的神經網絡模型進行驗證,根據驗證結果確定訓練好的目標神經網絡模型。
在其中一個實施例中,在所述通過所述訓練數據集對所述神經網絡模型進行迭代訓練,更新所述神經網絡模型的權重和學習率之前,所述方法還包括:
獲取所述樣本數據集的數據格式;
當所述數據格式不為所述神經網絡模型支持的預設數據格式時,從所述算法集成平臺中調用格式轉換腳本,將所述樣本數據集的數據格式轉換為預設數據格式;執行所述通過所述訓練數據集對所述神經網絡模型進行迭代訓練,更新所述神經網絡模型的權重和學習率步驟。
在其中一個實施例中,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于順豐科技有限公司,未經順豐科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010915750.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種遠程監控系統及物聯網固態繼電器
- 下一篇:一種雙層底制鞋設備





