[發明專利]一種特征提取網絡的訓練方法、裝置及電子設備在審
| 申請號: | 202210030447.8 | 申請日: | 2022-01-12 |
| 公開(公告)號: | CN114360027A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 李弼;彭楠;希滕;張剛 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/764;G06V10/82;G06K9/62;G06N3/08 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 孫翠賢;馬敬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 提取 網絡 訓練 方法 裝置 電子設備 | ||
本公開提供了一種特征提取網絡的訓練方法、裝置及電子設備,涉及數據處理技術領域,尤其涉及人工智能模型訓練領域。具體實現方案為:獲取訓練集中的樣本圖像;將樣本圖像輸入分類模型,得到模型輸出結果和樣本圖像的目標圖像特征;識別所述目標圖像特征和指定特征的相似性,得到識別結果;利用模型輸出結果與識別結果,生成樣本圖像的類別預測結果;基于類別預測結果和樣本圖像的類別標簽,對分類模型的模型參數進行調整,并返回獲取訓練集中樣本圖像的步驟,直至模型收斂,得到訓練完成的特征提取網絡。通過本方案,可以在降低資源占用的同時保證特征提取網絡的準確度。
技術領域
本公開涉及數據處理技術領域,尤其涉及人工智能模型訓練領域,具體涉及一種特征提取網絡的訓練方法、裝置及電子設備。
背景技術
針對對象識別場景而言,通常利用特征提取網絡,提取待識別圖像的圖像特征,然后,識別所提取圖像特征與底庫中各個圖像特征的相似性,并基于識別出的相似性,確定出待識別圖像中的對象。其中,底庫中每一圖像特征為針對一對象的圖像特征。
相關技術中,訓練用于進行對象分類的分類模型,待模型收斂后,將分類模型中的特征提取網絡,確定為訓練完成的特征提取網絡,以用于后續的對象識別場景。
發明內容
本公開提供了一種特征提取網絡的訓練方法、裝置及電子設備。
根據本公開的一方面,提供了一種特征提取網絡的訓練方法,包括:
獲取訓練集中的樣本圖像;
將所述樣本圖像輸入分類模型,得到模型輸出結果和所述樣本圖像的目標圖像特征;其中,所述分類模型包括特征提取網絡和全連接層,所述分類模型的全連接層用于建模各個目標類別,各個目標類別為所述訓練集所覆蓋的部分類別;
識別所述目標圖像特征和指定特征的相似性,得到識別結果;其中,所述指定特征為屬于輔助類別的圖像的圖像特征,各個目標類別和輔助類別中存在所述樣本圖像所屬的類別;
利用所述模型輸出結果與識別結果,生成所述樣本圖像的類別預測結果;
基于所述類別預測結果和所述樣本圖像的類別標簽,對所述分類模型的模型參數進行調整,并返回所述獲取訓練集中樣本圖像的步驟,直至模型收斂,得到訓練完成的特征提取網絡。
根據本公開的另一方面,提供了一種特征提取網絡的訓練裝置,包括:
獲取模塊,用于獲取訓練集中的樣本圖像;
輸入模塊,用于將所述樣本圖像輸入分類模型,得到模型輸出結果和所述樣本圖像的目標圖像特征;其中,所述分類模型包括特征提取網絡和全連接層,所述分類模型的全連接層用于建模各個目標類別,各個目標類別為所述訓練集所覆蓋的部分類別;
識別模塊,用于識別所述目標圖像特征和指定特征的相似性,得到識別結果;其中,所述指定特征為屬于輔助類別的圖像的圖像特征,各個目標類別和輔助類別中存在所述樣本圖像所屬的類別;
生成模塊,用于利用所述模型輸出結果與識別結果,生成所述樣本圖像的類別預測結果;
調整模塊,用于基于所述類別預測結果和所述樣本圖像的類別標簽,對所述分類模型的模型參數進行調整,并返回所述獲取訓練集中樣本圖像的步驟,直至模型收斂,得到訓練完成的特征提取網絡。
根據本公開的另一方面,提供了一種電子設備,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述特征提取網絡的訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210030447.8/2.html,轉載請聲明來源鉆瓜專利網。





