[發(fā)明專利]訓練目標檢測模型和構建樣本集的方法、裝置及存儲介質有效
| 申請?zhí)枺?/td> | 202210217860.5 | 申請日: | 2022-03-08 |
| 公開(公告)號: | CN114359676B | 公開(公告)日: | 2022-07-19 |
| 發(fā)明(設計)人: | 陳文晶;王堅;李兵;余昊楠;胡衛(wèi)明 | 申請(專利權)人: | 人民中科(濟南)智能技術有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06K9/62;G06T7/70 |
| 代理公司: | 北京萬思博知識產權代理有限公司 11694 | 代理人: | 劉冀 |
| 地址: | 250062 山東省濟南市中國(山東)自由貿易*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 訓練 目標 檢測 模型 構建 樣本 方法 裝置 存儲 介質 | ||
本申請涉及人工智能技術領域,特別是公開了一種訓練目標檢測模型和構建樣本集的方法、裝置及存儲介質。其中,該方法包括:利用第一訓練樣本集對第一目標檢測模型進行訓練,其中訓練樣本集包括第一圖像集合和第一標注集合,第一圖像集合包括多個第一圖像,第一標注集合包括分別與多個第一圖像對應的第一標注信息;利用第一目標檢測模型確定與第二圖像集合對應的第二標注集合,第二圖像集合包括多個第二圖像,第二標注集合包括分別與多個第二圖像對應的第二標注信息;以及將第一圖像與相應的第一標注信息進行配對,將第二圖像與相應的第二標注信息進行配對,并且利用配對后的圖像和標注信息對待訓練的目標檢測模型進行訓練。
技術領域
本申請涉及人工智能技術領域,特別是涉及一種訓練目標檢測模型和構建樣本集的方法、裝置及存儲介質。
背景技術
深度學習技術的迅速發(fā)展與大規(guī)模類別的標注數(shù)據(jù)推動了計算機視覺任務的發(fā)展與進步,包括圖像識別、目標檢測與圖像分割。其中,目標檢測技術作為計算機視覺任務中一個有著廣泛適用范圍和需求的基礎任務,受到了廣泛的關注。
和分類模型一樣,基于CNN的目標檢測模型需要大量的標注信息用于監(jiān)督訓練。但不同的是,分類訓練集數(shù)據(jù)只需要標注圖像的類別信息(class),而檢測訓練集數(shù)據(jù)需要同時標注圖像中的多個邊界框(bbox)和類別(class)。例如,當樣本圖像中包含多個目標對象時,則需要分別標注與每個目標對象對應的類別以及相應的邊界框的位置信息。研究表明,邊界框標注的時間約為10sec/ins,是類別標注耗時的10倍(1sec/class),因此獲得大規(guī)模的高質量檢測數(shù)據(jù)集代價十分高,這使得完全依賴監(jiān)督方法的目標檢測模型的訓練受到限制。
針對上述的現(xiàn)有技術中存在的目標檢測模型的檢測訓練集數(shù)據(jù)的標注成本高昂,導致目標檢測模型的訓練受到限制的的技術問題,目前尚未提出有效的解決方案。
發(fā)明內容
本公開的實施例提供了一種訓練目標檢測模型和構建樣本集的方法、裝置及存儲介質,以至少解決現(xiàn)有技術中存在的目標檢測模型的檢測訓練集數(shù)據(jù)的標注成本高昂,導致目標檢測模型的訓練受到限制的的技術問題。
根據(jù)本公開實施例的一個方面,提供了一種對目標檢測模型進行訓練的方法,包括:利用第一訓練樣本集對第一目標檢測模型進行訓練,其中訓練樣本集包括第一圖像集合和第一標注集合,第一圖像集合包括多個第一圖像,第一標注集合包括分別與多個第一圖像對應的第一標注信息,并且每個第一標注信息包括第一邊界框位置信息以及與第一邊界框位置信息對應的類別信息;利用第一目標檢測模型確定與第二圖像集合對應的第二標注集合,第二圖像集合包括多個第二圖像,第二標注集合包括分別與多個第二圖像對應的第二標注信息,并且每個第二標注信息包括第二邊界框位置信息以及與第二邊界框位置信息對應的類別信息;以及將第一圖像與相應的第一標注信息進行配對,將第二圖像與相應的第二標注信息進行配對,并且利用配對后的圖像和標注信息對待訓練的目標檢測模型進行訓練。
根據(jù)本公開實施例的另一方面,還提供了一種構建訓練樣本集的方法,包括:利用第一訓練樣本集對第一目標檢測模型進行訓練,其中訓練樣本集包括第一圖像集合和第一標注集合,第一圖像集合包括多個第一圖像,第一標注集合包括分別與多個第一圖像對應的第一標注信息,并且每個第一標注信息包括第一邊界框位置信息以及與第一邊界框位置信息對應的類別信息;利用第一目標檢測模型確定與第二圖像集合對應的第二標注集合,第二圖像集合包括多個第二圖像,第二標注集合包括分別與多個第二圖像對應的第二標注信息,并且每個第二標注信息包括第二邊界框位置信息以及與第二邊界框位置信息對應的類別信息;以及將第一圖像與相應的第一標注信息進行配對,將第二圖像與相應的第二標注信息進行配對,并且利用配對后的圖像和標注信息構建對待訓練的目標檢測模型進行訓練的訓練樣本集。
根據(jù)本公開實施例的另一個方面,還提供了一種存儲介質,存儲介質包括存儲的程序,其中,在程序運行時由處理器執(zhí)行以上任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于人民中科(濟南)智能技術有限公司,未經人民中科(濟南)智能技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210217860.5/2.html,轉載請聲明來源鉆瓜專利網。





