[發(fā)明專利]目標檢測模型的訓練方法、裝置、計算機設(shè)備和存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010118926.6 | 申請日: | 2020-02-26 |
| 公開(公告)號: | CN112749726B | 公開(公告)日: | 2023-09-29 |
| 發(fā)明(設(shè)計)人: | 羅澤坤;王亞彪;李劍;王昌安;彭瑾龍;汪鋮杰;李季檁;方正 | 申請(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V40/10 |
| 代理公司: | 華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 董慧;李文淵 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標 檢測 模型 訓練 方法 裝置 計算機 設(shè)備 存儲 介質(zhì) | ||
1.一種目標檢測模型的訓練方法,所述方法包括:
獲取樣本圖像及所述樣本圖像中多個目標對應的標注框;
通過目標檢測模型對所述樣本圖像進行目標檢測,獲得所述樣本圖像中多個目標對應的預測框,所述目標對應的預測框的數(shù)量為至少一個;
根據(jù)所述目標所對應的預測框與標注框之間的差異確定第一損失;
按照所對應的目標將預測框劃分,得到每個目標對應的預測框集合,迭代執(zhí)行將當前目標對應的預測框集合中置信度最大的預測框作為當前目標對應的匹配預測框,將所述當前目標對應的預測框集合中的其他預測框依次作為當前處理框,根據(jù)所述當前處理框與所述匹配預測框之間的第一重疊程度計算所述當前處理框與所述匹配預測框之間的拉近損失之后,從所述預測框集合中剔除所述匹配預測框的步驟,直至所述當前目標對應的預測框集合為空,融合各所述當前處理框與匹配預測框之間的拉近損失,得到用于增大所述當前目標所對應的預測框之間的重疊程度的第二損失,所述第二損失用于增大所述目標檢測模型輸出的相同目標所對應的預測框之間的重疊程度;
根據(jù)所述目標對應的預測框,獲得全量預測框集合,迭代執(zhí)行將所述全量預測框集合中置信度最大的預測框,作為當前處理框,遍歷所述全量預測框集合中與所述當前處理框之間的第二重疊程度大于預設(shè)閾值的預測框,當遍歷的預測框與所述當前處理框?qū)煌繕藭r,則根據(jù)所述當前處理框與所述遍歷的預測框之間的第二重疊程度計算所述當前處理框與所述遍歷的預測框之間的推開損失之后,從所述全量預測框集合中剔除所述當前處理框的步驟,直至所述全量預測框集合為空,融合所述當前處理框與遍歷的預測框之間的推開損失,得到用于減小不同目標所對應的預測框之間的重疊程度的第三損失,所述第三損失用于減小所述目標檢測模型輸出的不同目標所對應的預測框之間的重疊程度;
根據(jù)所述第一損失、所述第二損失及所述第三損失調(diào)整所述目標檢測模型的模型參數(shù)后,返回所述獲取樣本圖像及所述樣本圖像中多個目標對應的標注框的步驟繼續(xù)訓練,直至獲得訓練好的目標檢測模型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過目標檢測模型對所述樣本圖像進行目標檢測,獲得所述樣本圖像中多個目標對應的預測框,包括:
將所述樣本圖像輸入至目標檢測模型;
通過所述目標檢測模型中的特征提取網(wǎng)絡(luò),對所述樣本圖像進行特征提取,獲得所述樣本圖像對應的圖像特征;
通過所述目標檢測模型中的分類回歸層,根據(jù)所述圖像特征獲得所述樣本圖像中多個目標對應的預測框。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標所對應的預測框與標注框之間的差異確定第一損失,包括:
獲取所述目標對應的各個預測框的預測坐標信息;
獲取所述目標對應的標注框的真實坐標信息;
根據(jù)所述預測坐標信息與相應真實坐標信息之間的差異確定第一損失。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述當前處理框與所述匹配預測框之間的拉近損失與所述第一重疊程度成反相關(guān),且與所述當前處理框?qū)闹眯哦瘸烧嚓P(guān)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述當前處理框與所述匹配預測框之間的拉近損失通過以下公式確定:
Loss_pull(b,bmax)=-ln(1-N+IoU(b,bmax))*s;
其中,bmax表示當前目標對應的匹配預測框,b表示所述當前處理框,IoU(b,bmax)表示所述當前處理框b與所述匹配預測框bmax之間的第一重疊程度,N表示用于進行非極大值抑制處理的預設(shè)閾值,s表示所述當前處理框b的置信度,ln表示指數(shù)函數(shù),Loss_pull(b,bmax)表示所述當前處理框b與所述匹配預測框bmax之間的拉近損失。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
當所述遍歷的預測框與所述當前處理框?qū)嗤繕藭r,則直接從所述全量預測框集合中剔除所述遍歷的預測框。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述當前處理框與所述遍歷的預測框之間的推開損失與所述第二重疊程度成正相關(guān),且與所述遍歷的預測框?qū)闹眯哦瘸烧嚓P(guān)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010118926.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:電極錨安裝裝置
- 下一篇:身份識別方法、系統(tǒng)和設(shè)備





