[發明專利]圖像數據處理方法及裝置、目標檢測模型訓練方法及裝置在審
| 申請號: | 202011507842.8 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112633355A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 陳亮宇 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京鉦霖知識產權代理有限公司 11722 | 代理人: | 李英艷;李志新 |
| 地址: | 100080 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 數據處理 方法 裝置 目標 檢測 模型 訓練 | ||
本公開提供了一種圖像數據處理方法、目標檢測模型訓練方法、目標檢測方法、圖像數據處理裝置、目標檢測模型訓練裝置、目標檢測裝置、電子設備和計算機可讀存儲介質,其中圖像數據處理方法包括:獲取第一圖像集;基于第一圖像集,訓練數據處理模型;獲取第二圖像集;基于第二圖像集,通過完成訓練的數據處理模型,得到第三圖像集。本公開實施例能夠通過少量的具有邊界框的數據,將大量的僅有點監督數據的圖像進行邊界框的標注,從而高效的獲得大量的且質量優秀的具有邊界框的圖像。
技術領域
本公開一般地涉及圖像處理領域,具體涉及一種圖像數據處理方法、目標檢測模型訓練方法、目標檢測方法、圖像數據處理裝置、目標檢測模型訓練裝置、目標檢測裝置、電子設備和計算機可讀存儲介質。
背景技術
目前,在對圖像中的目標進行檢測的任務中,可以通過目標檢測模型檢測到圖像中的某一種或多種類別的目標,并根據目標的輪廓形成邊界框(bounding box),其中,目標檢測模型可以是卷積神經網絡模型等。然而,為了能夠實現上述任務,需要對目標檢測模型進行訓練,訓練的過程則需要大量的已經標注好邊界框的圖像。
對于訓練一個目標檢測模型來說,訓練集中的圖像數量以及邊界框的標注質量都對訓練效率、訓練結果有這顯著影響。目前,帶有標注的圖像通常需要大量人工對邊界框進行標注,而一個高質量邊界框的標注是非常耗時的,例如,在ILSVRC(ImageNet LargeScale Visual Recognition Challenge)的數據集上每個邊界框的標注需要約34秒,即使是普通質量的邊界框也需要10秒。因此,需要獲取到足夠數量和質量的圖像成本高、效率低。
發明內容
為了解決現有技術中存在的上述問題,本公開的第一方面提供一種圖像數據處理方法,其中,所述圖像數據處理方法包括:獲取第一圖像集,所述第一圖像集包括多個第一圖像及其對應的第一標注信息,其中,所述第一圖像包括至少一個第一目標、所述第一標注信息包括所述第一目標對應的第一邊界框和類別;基于所述第一圖像集,訓練數據處理模型;獲取第二圖像集,所述第二圖像集包括多個第二圖像及其對應的第二標注信息,其中,所述第二圖像包括至少一個第二目標、所述第二標注信息包括所述第二目標對應的第二標注點和類別;基于所述第二圖像集,通過完成訓練的所述數據處理模型,得到第三圖像集,所述第三圖像集包括所述多個第二圖像及其對應的第三標注信息,其中,所述第三標注信息包括所述第二目標對應的第二邊界框和類別。
在一實施例中,所述基于所述第一圖像集,訓練數據處理模型,包括:在所述第一圖像的每個第一邊界框內生成對應所述第一目標的第一標注點;基于所述第一圖像、以及所述第一圖像中所述第一目標對應的第一標注點及類別,通過待訓練的數據處理模型得到對應于所述第一目標的第一預測框;基于對應于同一第一目標的所述第一預測框與所述第一邊界框得到損失值;基于所述損失值調整待訓練的數據處理模型的參數,得到完成訓練的所述數據處理模型。
在一實施例中,所述基于所述第一圖像集,訓練數據處理模型,還包括:對所述第一標注點的坐標進行歸一化。
在一實施例中,所述損失值包括以下一種或多種,L1損失、IOU損失及GIOU損失。
在一實施例中,所述基于所述第二圖像集,通過完成訓練的所述數據處理模型,得到第三圖像集,包括:基于所述第二目標對應的第二標注點和類別,通過完成訓練的所述數據處理模型,得到所述第二目標對應的第二邊界框。
本公開的第二方面提供一種目標檢測模型訓練方法,其中,所述目標檢測模型用于圖像目標檢測,所述目標檢測模型訓練方法包括:獲取訓練集,所述訓練集至少包括采用如第一方面所述的圖像數據處理方法得到的所述第三圖像集;基于所述訓練集,訓練待訓練的目標檢測模型,得到訓練完成的所述目標檢測模型。
在一實施例中,所述訓練集還包括所述第一圖像集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011507842.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:過濾網機構和具有其的空調器
- 下一篇:一種TBM滾刀刀圈-巖石對磨試驗裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





