[發明專利]神經網絡訓練方法、裝置、電子設備以及存儲介質有效
| 申請號: | 202110069245.X | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112668718B | 公開(公告)日: | 2023-07-18 |
| 發明(設計)人: | 游山;鄭明凱;王飛;錢晨 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06N3/08 | 分類號: | G06N3/08;G06V10/82;G06V10/774;G06V10/74;G06F17/16 |
| 代理公司: | 北京中知恒瑞知識產權代理事務所(普通合伙) 11889 | 代理人: | 吳迪 |
| 地址: | 100080 北京市海淀區北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 方法 裝置 電子設備 以及 存儲 介質 | ||
本公開提供了一種神經網絡訓練方法、裝置、電子設備以及存儲介質,其中,該方法包括:獲取多個待處理樣本圖像;并確定每個待處理樣本圖像在多種圖像增強條件下的表征向量;基于表征向量構建目標核矩陣;對目標核矩陣進行行列式點過程DPP處理,得到相似樣本集;在多個待處理樣本圖像中刪除相似樣本集中的目標樣本圖像,以基于刪除目標樣本圖像之后的多個待處理樣本圖像對神經網絡進行訓練。本公開實施例通過刪除相似樣本之后的待處理樣本圖像對神經網絡進行訓練時可以為神經網絡提供更利的訓練樣本進行訓練,提高神經網絡的訓練精度。
技術領域
本公開涉及圖像數據技術領域,具體而言,涉及一種神經網絡訓練方法、裝置、電子設備以及存儲介質。
背景技術
目前,基于監督學習的神經網絡算法已經在各類視覺相關的問題上展現了強大的能力,然而監督學習當中的數據標注是比較難獲得的,監督學習中的數據標注往往需要花費大量的人力,并且通常難以保證數據標注的質量。
監督學習中的自監督學習旨在無數據標注的情況下,利用圖像自身的特征進行表征學習。在現有的自監督學習算法中,將數據庫中的每一張圖片都看作為一個類別,并且用網絡模型進行識別。然而,在數據規模比較大的情況下,數據中往往會出現許多語意上非常相似的樣本。現有的自監督學習算法會簡單的把這些相似的樣本看作不同的類別,此時,會降低網絡模型學習到的表征質量,從而降低網絡模型的處理精度。
發明內容
本公開實施例至少提供一種神經網絡訓練方法、裝置、電子設備以及存儲介質。
第一方面,本公開實施例提供了一種神經網絡訓練方法,包括:獲取多個待處理樣本圖像;并確定每個待處理樣本圖像在多種圖像增強條件下的表征向量;基于所述表征向量構建目標核矩陣;其中,所述目標核矩陣用于表征所述多個待處理樣本圖像之間的相似度和每個待處理樣本圖像在多種圖像增強條件下的差異度;對所述目標核矩陣進行行列式點過程DPP處理,得到相似樣本集,其中,所述相似樣本集中包含所述多個待處理樣本圖像中的至少一個目標樣本圖像,每個所述目標樣本圖像中的目標與在所述相似樣本集外的待處理樣本圖像中的至少部分目標相匹配;在所述多個待處理樣本圖像中刪除所述相似樣本集中的目標樣本圖像;基于刪除所述目標樣本圖像之后的所述多個待處理樣本圖像對神經網絡進行訓練。
在本公開實施例中,通過待處理樣本圖像的表征圖像確定目標核矩陣,并對目標核矩陣進行DPP處理,得到相似樣本集的方式,可以刪除待處理樣本圖像中的相似樣本,在此情況下,通過刪除相似樣本之后的待處理樣本圖像對神經網絡進行訓練的過程中,可以為神經網絡提供更利的訓練樣本進行訓練,從而提高了神經網絡的訓練精度。
一種可選的實施方式中,所述基于所述表征向量構建目標核矩陣,包括:基于每個待處理樣本圖像在多種圖像增強條件下的表征向量分別確定用于描述所述多個待處理樣本圖像之間相似度的相似度矩陣和每個所述待處理樣本圖像的樣本質量矩陣,其中,樣本質量用于表征每個待處理樣本圖像在多種圖像增強條件下的差異度;對所述相似度矩陣和所述樣本質量矩陣進行對位相乘處理,得到所述目標核矩陣。
在本公開實施例中,通過上述所描述的處理方式,可以從多個待處理樣本圖像中選擇出語義相近的樣本圖像丟棄,該處理方式可以減少神經網絡在進行訓練過程中所出現的類別碰撞問題。同時,在本公開實施例中,還通過結合樣本質量矩陣從多個待處理樣本圖像中選擇樣本質量低的樣本圖像丟棄,該處理方式可以提高神經網絡的訓練精度。
一種可選的實施方式中,所述基于每個待處理樣本圖像在多種圖像增強條件下的表征向量分別確定用于描述所述多個待處理樣本圖像之間相似度的相似度矩陣,包括:計算每個待處理樣本圖像在多種圖像增強條件下的表征向量的平均值,得到每個所述待處理樣本圖像的平均表征向量;基于每個所述待處理樣本圖像的平均表征向量,確定用于描述所述多個待處理樣本圖像之間相似度的相似度矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110069245.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:深層夯擴樁機鉆頭
- 下一篇:一種同時檢測多種長鏈非編碼RNA的復合物及方法





