[發明專利]神經網絡訓練及人臉比對的方法、裝置、設備及存儲介質在審
| 申請號: | 202210191460.1 | 申請日: | 2022-02-28 |
| 公開(公告)號: | CN114550267A | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 王宇杰 | 申請(專利權)人: | 上海商湯智能科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京中知恒瑞知識產權代理事務所(普通合伙) 11889 | 代理人: | 袁忠林 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 方法 裝置 設備 存儲 介質 | ||
1.一種神經網絡訓練的方法,其特征在于,所述方法包括:
獲取訓練數據、待訓練的第一神經網絡、以及與所述第一神經網絡相關的訓練好的第二神經網絡;
利用所述第一神經網絡對所述訓練數據進行特征提取,得到第一特征信息,以及利用所述第二神經網絡對所述訓練數據進行特征提取,得到第二特征信息;
基于所述第一特征信息和所述第二特征信息,確定所述第一神經網絡的損失函數值;
根據所述損失函數值對所述第一神經網絡進行至少一輪網絡訓練,得到訓練好的第一神經網絡。
2.根據權利要求1所述的方法,其特征在于,所述第一神經網絡包括至少一個第一特征提取層,所述第二神經網絡包括至少一個第二特征提取層;所述利用所述第二神經網絡對所述訓練數據進行特征提取,得到第二特征信息,包括:
將所述訓練數據輸入到所述第二神經網絡包括的至少一個第二特征提取層中,得到每個所述第二特征提取層輸出的第二特征信息;
所述利用所述第一神經網絡對所述訓練數據進行特征提取,得到第一特征信息,包括:
將所述訓練數據輸入到所述第一神經網絡包括的至少一個第一特征提取層中,得到每個所述第一特征提取層輸出的第一特征信息;
基于所述至少一個第二特征提取層輸出的第二特征信息對所述第一特征提取層輸出的第一特征信息進行更新,得到更新后的第一特征信息。
3.根據權利要求2所述的方法,其特征在于,每個所述第一特征提取層對應匹配有相關的至少一個第二特征提取層,且匹配的第二特征提取層所屬網絡層級與所述第一特征提取層所屬網絡層級相同或相近;所述基于所述至少一個第二特征提取層輸出的第二特征信息對所述第一特征提取層輸出的第一特征信息進行更新,得到更新后的第一特征信息,包括:
從所述至少一個第二特征提取層輸出的第二特征信息中選取與所述第一特征提取層匹配的第二特征提取層輸出的第二特征信息;
基于選取的所述第二特征信息對所述第一特征提取層輸出的第一特征信息進行更新,得到更新后的第一特征信息。
4.根據權利要求1至3任一所述的方法,其特征在于,所述第一神經網絡包括分類層;所述基于所述第一特征信息和所述第二特征信息,確定所述第一神經網絡的損失函數值,包括:
對所述第一特征信息和所述第二特征信息進行特征融合處理,得到融合后特征信息;
利用所述第一神經網絡包括的分類層針對所述融合后特征信息進行分類,得到分類結果;
基于所述分類結果以及所述訓練數據的標注結果,確定所述第一神經網絡的損失函數值。
5.根據權利要求4所述的方法,其特征在于,所述第一神經網絡還包括卷積層;所述對所述第一特征信息和所述第二特征信息進行特征融合處理,得到融合后特征信息,包括:
將所述第一特征信息和所述第二特征信息進行拼接,得到拼接后特征信息;
利用所述第一神經網絡包括的卷積層對所述拼接后特征信息進行卷積處理,得到特征維度符合所述第一神經網絡包括的分類層的輸入維度的卷積后特征信息;
將所述卷積后特征信息作為輸入所述第一神經網絡包括的分類層的所述融合后特征信息。
6.根據權利要求1至5任一所述的方法,其特征在于,所述根據所述損失函數值對所述第一神經網絡進行至少一輪網絡訓練,得到訓練好的第一神經網絡,包括:
在當前輪網絡訓練不滿足訓練迭代截止條件的情況下,根據所述損失函數值對所述第一神經網絡的網絡參數值進行調整,得到調整后的第一神經網絡;
基于調整后的第一神經網絡進行下一輪網絡訓練,直至下一輪網絡訓練滿足訓練迭代截止條件,得到訓練好的第一神經網絡。
7.根據權利要求1至6任一所述的方法,其特征在于,通過以下方式中的一種或多種確定所述第一神經網絡與所述第二神經網絡相關:
所述第一神經網絡的輸入數據與所述第二神經網絡的輸入數據存在至少部分相同的圖像區域;
所述第二神經網絡所對應的業務場景與所述第一神經網絡所對應的業務場景屬于相同或相近的應用領域;
所述第二神經網絡的輸出結果作為所述第一神經網絡的輸入數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯智能科技有限公司,未經上海商湯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210191460.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種神經網絡的生成方法、裝置、計算機設備及存儲介質
- 下一篇:一種體育拉筋器





