[發明專利]目標檢測模型的訓練方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202010118926.6 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN112749726B | 公開(公告)日: | 2023-09-29 |
| 發明(設計)人: | 羅澤坤;王亞彪;李劍;王昌安;彭瑾龍;汪鋮杰;李季檁;方正 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V40/10 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 董慧;李文淵 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 模型 訓練 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種目標檢測模型的訓練方法,所述方法包括:
獲取樣本圖像及所述樣本圖像中多個目標對應的標注框;
通過目標檢測模型對所述樣本圖像進行目標檢測,獲得所述樣本圖像中多個目標對應的預測框,所述目標對應的預測框的數量為至少一個;
根據所述目標所對應的預測框與標注框之間的差異確定第一損失;
按照所對應的目標將預測框劃分,得到每個目標對應的預測框集合,迭代執行將當前目標對應的預測框集合中置信度最大的預測框作為當前目標對應的匹配預測框,將所述當前目標對應的預測框集合中的其他預測框依次作為當前處理框,根據所述當前處理框與所述匹配預測框之間的第一重疊程度計算所述當前處理框與所述匹配預測框之間的拉近損失之后,從所述預測框集合中剔除所述匹配預測框的步驟,直至所述當前目標對應的預測框集合為空,融合各所述當前處理框與匹配預測框之間的拉近損失,得到用于增大所述當前目標所對應的預測框之間的重疊程度的第二損失,所述第二損失用于增大所述目標檢測模型輸出的相同目標所對應的預測框之間的重疊程度;
根據所述目標對應的預測框,獲得全量預測框集合,迭代執行將所述全量預測框集合中置信度最大的預測框,作為當前處理框,遍歷所述全量預測框集合中與所述當前處理框之間的第二重疊程度大于預設閾值的預測框,當遍歷的預測框與所述當前處理框對應不同目標時,則根據所述當前處理框與所述遍歷的預測框之間的第二重疊程度計算所述當前處理框與所述遍歷的預測框之間的推開損失之后,從所述全量預測框集合中剔除所述當前處理框的步驟,直至所述全量預測框集合為空,融合所述當前處理框與遍歷的預測框之間的推開損失,得到用于減小不同目標所對應的預測框之間的重疊程度的第三損失,所述第三損失用于減小所述目標檢測模型輸出的不同目標所對應的預測框之間的重疊程度;
根據所述第一損失、所述第二損失及所述第三損失調整所述目標檢測模型的模型參數后,返回所述獲取樣本圖像及所述樣本圖像中多個目標對應的標注框的步驟繼續訓練,直至獲得訓練好的目標檢測模型。
2.根據權利要求1所述的方法,其特征在于,所述通過目標檢測模型對所述樣本圖像進行目標檢測,獲得所述樣本圖像中多個目標對應的預測框,包括:
將所述樣本圖像輸入至目標檢測模型;
通過所述目標檢測模型中的特征提取網絡,對所述樣本圖像進行特征提取,獲得所述樣本圖像對應的圖像特征;
通過所述目標檢測模型中的分類回歸層,根據所述圖像特征獲得所述樣本圖像中多個目標對應的預測框。
3.根據權利要求1所述的方法,其特征在于,所述根據所述目標所對應的預測框與標注框之間的差異確定第一損失,包括:
獲取所述目標對應的各個預測框的預測坐標信息;
獲取所述目標對應的標注框的真實坐標信息;
根據所述預測坐標信息與相應真實坐標信息之間的差異確定第一損失。
4.根據權利要求1所述的方法,其特征在于,所述當前處理框與所述匹配預測框之間的拉近損失與所述第一重疊程度成反相關,且與所述當前處理框對應的置信度成正相關。
5.根據權利要求1所述的方法,其特征在于,所述當前處理框與所述匹配預測框之間的拉近損失通過以下公式確定:
Loss_pull(b,bmax)=-ln(1-N+IoU(b,bmax))*s;
其中,bmax表示當前目標對應的匹配預測框,b表示所述當前處理框,IoU(b,bmax)表示所述當前處理框b與所述匹配預測框bmax之間的第一重疊程度,N表示用于進行非極大值抑制處理的預設閾值,s表示所述當前處理框b的置信度,ln表示指數函數,Loss_pull(b,bmax)表示所述當前處理框b與所述匹配預測框bmax之間的拉近損失。
6.根據權利要求1所述的方法,其特征在于,所述方法還包括:
當所述遍歷的預測框與所述當前處理框對應相同目標時,則直接從所述全量預測框集合中剔除所述遍歷的預測框。
7.根據權利要求1所述的方法,其特征在于,所述當前處理框與所述遍歷的預測框之間的推開損失與所述第二重疊程度成正相關,且與所述遍歷的預測框對應的置信度成正相關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010118926.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電極錨安裝裝置
- 下一篇:身份識別方法、系統和設備





