[發明專利]神經網絡訓練及人臉比對的方法、裝置、設備及存儲介質在審
| 申請號: | 202210191460.1 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114550267A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 王宇杰 | 申請(專利權)人: | 上海商湯智能科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京中知恒瑞知識產權代理事務所(普通合伙) 11889 | 代理人: | 袁忠林 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 方法 裝置 設備 存儲 介質 | ||
本公開提供了一種神經網絡訓練、人臉比對的方法及裝置、設備及存儲介質,其中,該方法包括:獲取訓練數據、待訓練的第一神經網絡、以及與第一神經網絡相關的訓練好的第二神經網絡;利用第一神經網絡對訓練數據進行特征提取,得到第一特征信息,以及利用第二神經網絡對訓練數據進行特征提取,得到第二特征信息;基于第一特征信息和第二特征信息,確定第一神經網絡的損失函數值;根據損失函數值對第一神經網絡進行至少一輪網絡訓練,得到訓練好的第一神經網絡。基于兩個特征信息所確定的損失函數值可以更為精確的進行網絡調整,從而提升網絡的訓練精度,且在進行網絡調整的過程中,無需對第二神經網絡進行調整,可以顯著提升訓練效率。
技術領域
本公開涉及計算機技術領域,具體而言,涉及一種神經網絡訓練、人臉比對的方法及裝置、設備及存儲介質。
背景技術
隨著深度學習的不斷發展,各種機器學習模型在各行各業取得了越來越大的成功。有關模型精度的提升一直是業內比較關注的問題。
相關技術中提供了兩種提升模型精度的方法,一種是多模型集成訓練方法,該方法通常利用多個模型的預測結果給出最終的預測(例如,選取票數最高的預測結果作為最終的預測結果),以得到更為準確的預測結果;另一種則是多任務訓練方法,該方法利用多個任務同時訓練模型,這些任務共享主干網絡,用不同的預測器在主干網絡所提取到的特征的基礎上做不同的任務,而基于不同任務所訓練的主干網絡可以兼顧多種任務需求,具有更高的魯棒性,從而提升后續利用主干網絡進行預測的精度。
然而,上述第一種方法由于需要對所有模型進行推理,這將耗費成倍的計算開銷,第二種方法則可能由于任務差異性導致難以同時兼顧優化各個任務的性能,導致模型精度較低。
發明內容
本公開實施例至少提供一種神經網絡訓練、人臉比對的方法及裝置、設備及存儲介質,在不產生額外計算開銷的前提下,提升了模型精度。
第一方面,本公開實施例提供了一種神經網絡訓練的方法,所述方法包括:
獲取訓練數據、待訓練的第一神經網絡、以及與所述第一神經網絡相關的訓練好的第二神經網絡;
利用所述第一神經網絡對所述訓練數據進行特征提取,得到第一特征信息,以及利用所述第二神經網絡對所述訓練數據進行特征提取,得到第二特征信息;
基于所述第一特征信息和所述第二特征信息,確定所述第一神經網絡的損失函數值;
根據所述損失函數值對所述第一神經網絡進行至少一輪網絡訓練,得到訓練好的第一神經網絡。
采用上述神經網絡訓練的方法,在需要對第一神經網絡進行訓練的情況下,可以一方面利用第一神經網絡對訓練數據進行特征提取,另一方面利用訓練好的第二神經網絡對訓練數據進行特征提取,分別得到第一特征信息和第二特征信息。由于第二神經網絡是與第一神經網絡相關的網絡,通過所提取的第二特征信息可以對第一特征信息進行特征補充。在提取的特征更為豐富的情況下,基于這些特征所確定的損失函數值可以更為精確的進行網絡調整,從而提升網絡的訓練精度,且在進行網絡調整的過程中,采用的是已訓練好的第二特征網絡,無需對該網絡進行調整,不會耗費額外的計算開銷,從而可以顯著提升訓練效率。
在一種可能的實施方式中,所述第一神經網絡包括至少一個第一特征提取層,所述第二神經網絡包括至少一個第二特征提取層;所述利用所述第二神經網絡對所述訓練數據進行特征提取,得到第二特征信息,包括:
將所述訓練數據輸入到所述第二神經網絡包括的至少一個第二特征提取層中,得到每個所述第二特征提取層輸出的第二特征信息;
所述利用所述第一神經網絡對所述訓練數據進行特征提取,得到第一特征信息,包括:
將所述訓練數據輸入到所述第一神經網絡包括的至少一個第一特征提取層中,得到每個所述第一特征提取層輸出的第一特征信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯智能科技有限公司,未經上海商湯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210191460.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種神經網絡的生成方法、裝置、計算機設備及存儲介質
- 下一篇:一種體育拉筋器





