[發明專利]圖像檢測模型的訓練方法和裝置有效
| 申請號: | 202010318213.4 | 申請日: | 2020-04-21 |
| 公開(公告)號: | CN111563541B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 龍翔;高原 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 檢測 模型 訓練 方法 裝置 | ||
本申請公開了圖像檢測模型的訓練方法和裝置,涉及計算機視覺技術領域。具體實施方式包括:獲取目標圖像的目標特征圖,以及利用圖像檢測模型,預測該目標特征圖中每個區塊到該區塊所在的對象在指定方向上最遠的邊界的距離并作為目標距離,以及根據該目標距離以及該區塊的坐標,確定該邊界的位置;基于該目標特征圖中區塊的指示預設對象類別的偽標簽,確定屬于相同預設對象類別且距離在預設范圍內的任意兩個區塊;基于該任意兩個區塊分別所在的對象的邊界的位置的差,確定目標距離對應的損失值;基于該損失值,訓練該圖像檢測模型,得到訓練后的圖像檢測模型。本申請將兩個區塊所對應的邊界位置一致作為訓練目標,可以有效區別圖像中不同的對象。
技術領域
本申請實施例涉及計算機技術領域,具體涉及計算機視覺技術領域,尤其涉及圖像檢測模型的訓練方法和裝置。
背景技術
目標檢測是計算機視覺的基礎能力之一,在各個領域都發揮了重要作用。通過目標檢測可以對圖像中的對象進行分類。在現有技術中,一般會將圖像輸入檢測模型比如深度神經網絡進行目標檢測,從而利用深度神經網絡,預測圖像中的對象的類別。
普通的目標檢測需要大量的帶檢測框的人工標注樣本進行檢測模型的訓練,而檢測框的人工標注成本非常高,標注大量數據的時間周期也很長。
發明內容
提供了圖像檢測模型的訓練方法、裝置、電子設備和存儲介質。
根據第一方面,提供了一種圖像檢測模型的訓練方法,包括:獲取目標圖像的目標特征圖,以及利用圖像檢測模型,預測目標特征圖中每個區塊到該區塊所在的對象在指定方向上最遠的邊界的距離并作為目標距離,以及根據目標距離以及該區塊的坐標,確定邊界的位置,其中,該區塊所在的對象為該區塊所屬于的預設對象類別所指示的對象;基于目標特征圖中區塊的指示預設對象類別的偽標簽,確定屬于相同預設對象類別且距離在預設范圍內的任意兩個區塊;基于任意兩個區塊分別所在的對象的邊界的位置的差,確定目標距離對應的損失值;基于損失值,訓練圖像檢測模型,得到訓練后的圖像檢測模型。
根據第二方面,提供了一種圖像檢測模型的訓練裝置,包括:獲取單元,被配置成獲取目標圖像的目標特征圖,以及利用圖像檢測模型,預測目標特征圖中每個區塊到該區塊所在的對象在指定方向上最遠的邊界的距離并作為目標距離,以及根據目標距離以及該區塊的坐標,確定邊界的位置,其中,該區塊所在的對象為該區塊所屬于的預設對象類別所指示的對象;第一確定單元,被配置成基于目標特征圖中區塊的指示預設對象類別的偽標簽,確定屬于相同預設對象類別且距離在預設范圍內的任意兩個區塊;第二確定單元,被配置成基于任意兩個區塊分別所在的對象的邊界的位置的差,確定目標距離對應的損失值;訓練單元,被配置成基于損失值,訓練圖像檢測模型,得到訓練后的圖像檢測模型。
根據第三方面,提供了一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執行,使得一個或多個處理器實現如圖像檢測模型的訓練方法中任一實施例的方法。
根據第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如圖像檢測模型的訓練方法中任一實施例的方法。
根據本申請的通過同一類別的兩個區塊可以準確地預測該類別對象的邊界位置,并且通過限定兩個區塊之間的距離,避免了對不同的對象中的兩個區塊進行操作。此外,本申請實施例將兩個區塊所對應的邊界位置一致作為訓練目標,從而可以實現訓練后的圖像檢測模型對不同對象所預測的邊界位置不同,有效區別圖像中不同的對象,提升同時對多對象圖像中每個對象的檢測效果。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
圖1是本申請一些實施例可以應用于其中的示例性系統架構圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010318213.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電力線通信去噪方法、控制設備及計算機可讀存儲介質
- 下一篇:鋼管吊架
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





