[發明專利]動態柜圖像識別模型訓練方法、裝置、電子設備和介質有效
| 申請號: | 202210115424.7 | 申請日: | 2022-02-07 |
| 公開(公告)號: | CN114155366B | 公開(公告)日: | 2022-05-20 |
| 發明(設計)人: | 鄧博洋;程楊武 | 申請(專利權)人: | 北京每日優鮮電子商務有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 北京唯智勤實知識產權代理事務所(普通合伙) 11557 | 代理人: | 史立狀 |
| 地址: | 100102 北京市朝陽區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 動態 圖像 識別 模型 訓練 方法 裝置 電子設備 介質 | ||
本公開的實施例公開了動態柜圖像識別模型訓練方法、裝置、電子設備和介質。該方法的一具體實施方式包括:獲取第一動態柜圖像;將第一動態柜圖像輸入至預先訓練的第一圖像特征提取網絡,得到第一圖像特征向量;確定第一動態柜圖像所對應的至少一個第一檢測框;根據第一動態柜圖像、第一圖像特征向量、預先存儲的第二動態柜圖像集,預先存儲的第一物品圖像集和至少一個第一檢測框,生成第三動態柜圖像;將第三動態柜圖像作為訓練圖像樣本,利用機器學習模型訓練方法,訓練動態柜圖像識別模型,得到訓練后的動態柜圖像識別模型。該實施方式可以生成識別效果更為精準的動態柜圖像識別模型。
技術領域
本公開的實施例涉及計算機技術領域,具體涉及動態柜圖像識別模型訓練方法、裝置、電子設備和介質。
背景技術
目前,目標檢測模型已廣泛應用于各個領域。當前目標檢測模型訓練過程中,常常存在目標檢測模型對應訓練圖像樣本不足的問題。對于生成更多的訓練圖像樣本,通常采用的方式為:通過數據增強的方式(例如,圖像旋轉,圖像移位,圖像放縮等方式)來生成更多的訓練圖像樣本。
然而,當采用上述方式來生成訓練圖像樣本,經常會存在如下技術問題:
第一,數據增強生成的訓練圖像樣本樣式較為單一,不能為后續目標檢測模型的訓練提供更多的特征信息,導致后續訓練后的目標檢測模型的預測精準度較低。
第二,提取第一動態柜圖像的特征提取網絡往往需要第一動態柜圖像的標簽。現實生活中,往往需要大量第一動態柜圖像來對目標檢測模型進行訓練。大量動態柜圖像的標注浪費了大量時間,且存在動態柜圖像標注錯誤的問題。
第三,利用數據增強中圖像裁剪和相似圖像拼接的方式,所生成的訓練圖像樣本雖然存在較多的特征信息。但是,存在確認相似圖像準確率較低的問題。
發明內容
本公開的內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本公開的內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
本公開的一些實施例提出了動態柜圖像識別模型訓練方法、裝置、電子設備和計算機可讀介質,來解決以上背景技術部分提到的技術問題中的一項或多項。
第一方面,本公開的一些實施例提供了一種動態柜圖像識別模型訓練方法,包括:獲取第一動態柜圖像;將上述第一動態柜圖像輸入至預先訓練的第一圖像特征提取網絡,得到第一圖像特征向量;確定上述第一動態柜圖像所對應的至少一個第一檢測框;根據上述第一動態柜圖像、上述第一圖像特征向量、預先存儲的第二動態柜圖像集,預先存儲的第一物品圖像集和上述至少一個第一檢測框,生成第三動態柜圖像,其中,上述第二動態柜圖像集存在對應的第二檢測框集組,上述第二檢測框集組中各個第二檢測框對應的圖像為上述第一物品圖像集;將上述第三動態柜圖像作為訓練圖像樣本,利用機器學習模型訓練方法,訓練動態柜圖像識別模型,得到訓練后的動態柜圖像識別模型。
第二方面,本公開的一些實施例提供了一種動態柜圖像識別模型訓練裝置,包括:獲取單元,被配置成獲取第一動態柜圖像;輸入單元,被配置成將上述第一動態柜圖像輸入至預先訓練的第一圖像特征提取網絡,得到第一圖像特征向量;確定單元,被配置成確定上述第一動態柜圖像所對應的至少一個第一檢測框;生成單元,被配置成根據上述第一動態柜圖像、上述第一圖像特征向量、預先存儲的第二動態柜圖像集,預先存儲的第一物品圖像集和上述至少一個第一檢測框,生成第三動態柜圖像,其中,上述第二動態柜圖像集存在對應的第二檢測框集組,上述第二檢測框集組中各個第二檢測框對應的圖像為上述第一物品圖像集;訓練單元,被配置成將上述第三動態柜圖像作為訓練圖像樣本,利用機器學習模型訓練方法,訓練動態柜圖像識別模型,得到訓練后的動態柜圖像識別模型。
第三方面,本公開的一些實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,其上存儲有一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如第一方面中任一實現方式描述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京每日優鮮電子商務有限公司,未經北京每日優鮮電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210115424.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種API自動生成系統
- 下一篇:一種TPU復合膠水、保護膜及其制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





