[發明專利]一種神經網絡模型訓練方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110304132.3 | 申請日: | 2021-03-22 |
| 公開(公告)號: | CN113065641B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 高志鵬;苗東;芮蘭蘭;莫梓嘉;趙晨;林怡靜;譚清;付偉 | 申請(專利權)人: | 北京郵電大學;北京驅云科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06V10/26;G06V10/764;G06V10/774;G06V10/82 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 丁蕓;趙元 |
| 地址: | 100876 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 神經網絡 模型 訓練 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供的神經網絡模型訓練方法、裝置、電子設備及存儲介質,應用于信息技術領域,通過根據預設的多組分割點將待訓練的圖像分類網絡模型分割為多組子網絡模型;針對各組子網絡模型,通過預設損失函數分別計算對應的損失;針對各組子網絡模型,根據計算得到的損失進行聯合訓練,得到多組待輸出子網絡模型;針對各組子網絡模型,分別計算各待輸出子網絡模型對應的多項性能參數;根據各組子網絡模型對應的多項性能參數,通過預設熵權模型,分別計算各組子網絡模型對應的綜合性能得分;選取各組子網絡模型中綜合性能得分最高的一組作為目標子網絡模型。可以按照目標子網絡模型進行圖像分類網絡模型的部署,從而提高神經網絡部署的便利性。
技術領域
本申請涉及模型訓練的技術領域,特別是涉及一種神經網絡模型訓練方法、裝置、電子設備及存儲介質。
背景技術
目前,人工智能已經可以代替人類完成認知、識別、分析、決策等功能的一項技術。通過人工智能可以實現:圖像識別、語音識別、智能生活、自動駕駛等,從而為人們的生活提供極大的便利。
然而,應用在人工智能領域的神經網絡的結構往往過于龐大,對于計算資源和存儲資源的要求很高,因此,目前大多數的基于深度神經網絡的應用均需依賴于有著海量計算資源的云平臺,從而給人工智能及其相關服務的發展帶來了極大的局限性。
發明內容
本申請實施例的目的在于提供一種神經網絡模型訓練方法、裝置、電子設備及存儲介質,用以解決如何提高神經網絡部署的便利性的問題。具體技術方案如下:
本申請實施例的第一方面,首先提供了一種神經網絡模型訓練方法,所述方法包括:
根據預設的多組分割點將待訓練的圖像分類網絡模型分割為多組子網絡模型,其中,每一組子網絡模型均包括第一子網絡模型、第二子網絡模型和第三子網絡模型;
針對各組子網絡模型,將樣本圖像輸入所述第一子網絡模型,并以所述第一子網絡模型的輸出作為所述第二子網絡模型的輸入,以所述第二子網絡模型的輸出作為所述第一子網絡模型的輸入,生成所述第三子網絡模型輸出的圖像分類結果;
針對各組子網絡模型,通過預設損失函數分別計算所述第一子網絡模型的輸出對應的第一損失、所述第二子網絡模型的輸出對應的第二損失和所述第三子網絡模型輸出的圖像分類結果對應的第三損失;
針對各組子網絡模型,分別通過對應的所述第一損失、所述第二損失和所述第三損失,對對應的所述第一子網絡模型、所述第二子網絡模型和所述第三子網絡模型進行聯合訓練,得到第一待輸出子網絡模型、第二待輸出子網絡模型和第三待輸出子網絡模型;
針對各組子網絡模型,分別計算所述第一待輸出子網絡模型、所述第二待輸出子網絡模型和所述第三待輸出子網絡模型對應的多項性能參數;
根據各組子網絡模型對應的多項性能參數,通過預設熵權模型,分別計算各組子網絡模型對應的綜合性能得分;
選取所述各組子網絡模型中綜合性能得分最高的一組作為目標子網絡模型。
本申請實施例的第二方面,還提供了一種神經網絡模型訓練裝置,所述裝置包括:
模型分割模塊,用于根據預設的多組分割點將待訓練的圖像分類網絡模型分割為多組子網絡模型,其中,每一組子網絡模型均包括第一子網絡模型、第二子網絡模型和第三子網絡模型;
結果生成模塊,用于針對各組子網絡模型,將樣本圖像輸入所述第一子網絡模型,并以所述第一子網絡模型的輸出作為所述第二子網絡模型的輸入,以所述第二子網絡模型的輸出作為所述第一子網絡模型的輸入,生成所述第三子網絡模型輸出的圖像分類結果;
損失計算模塊,用于針對各組子網絡模型,通過預設損失函數分別計算所述第一子網絡模型的輸出對應的第一損失、所述第二子網絡模型的輸出對應的第二損失和所述第三子網絡模型輸出的圖像分類結果對應的第三損失;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京郵電大學;北京驅云科技有限公司,未經北京郵電大學;北京驅云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110304132.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:屏幕角度校準方法及設備
- 下一篇:一種雙金屬結片機轉鼓的激光制造工藝





