[發(fā)明專利]目標檢測模型的訓練方法、目標檢測方法、裝置及設備有效
| 申請?zhí)枺?/td> | 202210495852.7 | 申請日: | 2022-05-09 |
| 公開(公告)號: | CN114596497B | 公開(公告)日: | 2022-08-19 |
| 發(fā)明(設計)人: | 陳博;高原;白錦峰 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/40;G06V10/774;G06V10/764 |
| 代理公司: | 北京開陽星知識產權代理有限公司 11710 | 代理人: | 范彥揚 |
| 地址: | 100089 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 檢測 模型 訓練 方法 裝置 設備 | ||
1.一種目標檢測模型的訓練方法,其中,所述目標檢測模型包括依次連接的骨干網(wǎng)絡和學生預測網(wǎng)絡;所述方法包括:
獲取攜帶有標注信息的圖像樣本;
將所述圖像樣本輸入至所述骨干網(wǎng)絡,得到初步特征;
將所述初步特征輸入至所述學生預測網(wǎng)絡,得到第一檢測結果;以及,將所述初步特征輸入至預設的教師預測網(wǎng)絡,得到第二檢測結果;
基于所述第一檢測結果、所述第二檢測結果和所述標注信息對所述骨干網(wǎng)絡、所述學生預測網(wǎng)絡和所述教師預測網(wǎng)絡進行訓練,直至達到預設條件時停止訓練;其中,所述教師預測網(wǎng)絡用于在訓練過程中為所述學生預測網(wǎng)絡提供指定信息,所述指定信息是所述教師預測網(wǎng)絡生成的與所述第二檢測結果相關的信息;
基于停止訓練后的所述骨干網(wǎng)絡及所述學生預測網(wǎng)絡得到訓練好的目標檢測模型;
基于所述第一檢測結果、所述第二檢測結果和所述標注信息對所述骨干網(wǎng)絡、所述學生預測網(wǎng)絡和所述教師預測網(wǎng)絡進行訓練,直至達到預設條件時停止訓練的步驟,包括:
基于所述第一檢測結果、所述第二檢測結果和所述標注信息調整所述骨干網(wǎng)絡、所述學生預測網(wǎng)絡和所述教師預測網(wǎng)絡的網(wǎng)絡參數(shù);
在達到第一預設條件時停止調整所述教師預測網(wǎng)絡的網(wǎng)絡參數(shù),以及達到第二預設條件時停止調整所述骨干網(wǎng)絡和所述學生預測網(wǎng)絡的網(wǎng)絡參數(shù);其中,所述教師預測網(wǎng)絡的停止調整時間早于所述骨干網(wǎng)絡和所述學生預測網(wǎng)絡的停止調整時間;
其中,基于所述第一檢測結果、所述第二檢測結果和所述標注信息調整所述骨干網(wǎng)絡、所述學生預測網(wǎng)絡和所述教師預測網(wǎng)絡的網(wǎng)絡參數(shù)的步驟,包括:
基于所述第一檢測結果、所述第二檢測結果、所述標注信息和預設的學生損失函數(shù),得到學生損失函數(shù)值;
基于所述第二檢測結果、所述標注信息和預設的教師損失函數(shù),得到教師損失函數(shù)值;
基于所述學生損失函數(shù)值和所述教師損失函數(shù)值調整所述骨干網(wǎng)絡的網(wǎng)絡參數(shù),基于所述學生損失函數(shù)值調整所述學生預測網(wǎng)絡的網(wǎng)絡參數(shù),以及,基于所述教師損失函數(shù)值調整所述教師預測網(wǎng)絡的網(wǎng)絡參數(shù)。
2.如權利要求1所述的目標檢測模型的訓練方法,其中,所述指定信息包括基于所述第二檢測結果得到的標簽分配信息和/或特征概率分布圖。
3.如權利要求1所述的目標檢測模型的訓練方法,基于所述第一檢測結果、所述第二檢測結果、所述標注信息和預設的學生損失函數(shù),得到學生損失函數(shù)值的步驟,包括:
基于所述第二檢測結果和所述標注信息得到所述圖像樣本的標簽分配信息;
基于所述第一檢測結果、所述標簽分配信息、所述標注信息和所述預設的學生損失函數(shù),得到學生損失函數(shù)值。
4.如權利要求3所述的目標檢測模型的訓練方法,其中,所述第一檢測結果包括第一分類分數(shù)圖和第一回歸分數(shù)圖;所述第二檢測結果包括第二分類分數(shù)圖和第二回歸分數(shù)圖;
基于所述第二檢測結果和所述標注信息得到所述圖像樣本的標簽分配信息的步驟,包括:
基于所述第二分類分數(shù)圖、所述第二回歸分數(shù)圖和所述標注信息得到代價矩陣;
根據(jù)所述代價矩陣得到標簽分配信息。
5.如權利要求1所述的目標檢測模型的訓練方法,其中,所述學生損失函數(shù)包括第一分類損失函數(shù)、第一回歸損失函數(shù)和蒸餾損失函數(shù);所述教師損失函數(shù)包括第二分類損失函數(shù)和第二回歸損失函數(shù)。
6.如權利要求5所述的目標檢測模型的訓練方法,其中,所述蒸餾損失函數(shù)是基于所述教師預測網(wǎng)絡生成的第二特征概率分布圖和所述學生預測網(wǎng)絡生成的第一特征概率分布圖之間的差異確定;所述第一特征概率分布圖與所述第一檢測結果相關;所述第二特征概率分布圖與所述第二檢測結果相關。
7.如權利要求6所述的目標檢測模型的訓練方法,其中,所述第一特征概率分布圖是所述學生預測網(wǎng)絡輸出的第一分類分數(shù)圖進行歸一化處理后得到的;所述第二特征概率分布圖是所述教師預測網(wǎng)絡輸出的第二分類分數(shù)圖進行歸一化處理后得到的;所述第一分類分數(shù)圖屬于所述第一檢測結果,所述第二分類分數(shù)圖屬于所述第二檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經(jīng)北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210495852.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





