[發(fā)明專利]目標檢測方法及裝置、存儲介質(zhì)、終端有效
| 申請?zhí)枺?/td> | 202011373448.X | 申請日: | 2020-11-30 |
| 公開(公告)號: | CN112446378B | 公開(公告)日: | 2022-09-16 |
| 發(fā)明(設(shè)計)人: | 陳圣衛(wèi) | 申請(專利權(quán))人: | 展訊通信(上海)有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/46;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 張振軍 |
| 地址: | 201203 上海市浦東新區(qū)張*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標 檢測 方法 裝置 存儲 介質(zhì) 終端 | ||
1.一種目標檢測方法,其特征在于,所述方法包括:
獲取樣本圖像,所述樣本圖像包括預(yù)設(shè)目標;
提取所述樣本圖像的初始特征圖,并對所述初始特征圖進行語義信息增強處理,以得到所述樣本圖像的第一預(yù)測圖,所述第一預(yù)測圖用于指示所述樣本圖像的目標區(qū)域和背景區(qū)域,所述目標區(qū)域為包含所述預(yù)設(shè)目標的區(qū)域,所述背景區(qū)域為未包含所述預(yù)設(shè)目標的區(qū)域;
根據(jù)所述第一預(yù)測圖和第二預(yù)測圖對檢測網(wǎng)絡(luò)模型進行訓(xùn)練,以得到訓(xùn)練后的檢測網(wǎng)絡(luò)模型,其中,所述第二預(yù)測圖是根據(jù)所述初始特征圖對所述樣本圖像進行計算得到的,所述第二預(yù)測圖用于指示所述預(yù)設(shè)目標的邊界框;
采用訓(xùn)練后的檢測網(wǎng)絡(luò)模型檢測待測圖像,以得到所述待測圖像中所述預(yù)設(shè)目標的檢測結(jié)果;
其中,所述檢測網(wǎng)絡(luò)模型的損失函數(shù)為Loss=λsemantic Lsemantic+λmodel Lmodel,其中,Loss為所述檢測網(wǎng)絡(luò)模型的損失函數(shù),Lsemantic為第一損失函數(shù),Lmodel為第二損失函數(shù),λsemantic為第一損失函數(shù)的權(quán)重系數(shù),λmodel為第二損失函數(shù)的權(quán)重系數(shù);
其中,第一損失函數(shù)值是由所述第一預(yù)測圖、所述樣本圖像和所述第一損失函數(shù)計算得到,第二損失函數(shù)值是由所述第二預(yù)測圖、所述樣本圖像和所述第二損失函數(shù)計算得到。
2.根據(jù)權(quán)利要求1所述的目標檢測方法,其特征在于,所述初始特征圖的每個像素點包括多個通道,所述初始特征圖是通過對所述樣本圖像進行下采樣得到的,則對所述初始特征圖進行語義信息增強處理包括:
步驟一:對所述初始特征圖進行2倍上采樣,以得到第一特征圖;
步驟二:根據(jù)通道注意力機制對所述第一特征圖進行處理,以得到第二特征圖;
步驟三:將所述第二特征圖作為新的初始特征圖;
重復(fù)執(zhí)行步驟一至步驟三,直至所述上采樣倍數(shù)與所述下采樣倍數(shù)相等;
步驟四:對所述初始特征圖進行第一卷積運算,以得到所述第一預(yù)測圖,其中,所述第一預(yù)測圖的通道數(shù)量為2。
3.根據(jù)權(quán)利要求2所述的目標檢測方法,其特征在于,根據(jù)通道注意力機制對所述第一特征圖進行處理之前,所述方法還包括:
對所述第一特征圖進行多次第二卷積運算,每次第二卷積運算采用1×1的卷積核;
將多次第二卷積運算的結(jié)果與所述第一特征圖相加,以得到新的第一特征圖。
4.根據(jù)權(quán)利要求2或3所述的目標檢測方法,其特征在于,根據(jù)通道注意力機制對所述第一特征圖進行處理之前,所述方法還包括:
對所述第一特征圖進行多次第三卷積運算,多次第三卷積運算中至少一次采用3×3的卷積核;
將多次第三卷積運算的結(jié)果與所述第一特征圖相加,以得到新的第一特征圖。
5.根據(jù)權(quán)利要求3所述的目標檢測方法,其特征在于,對所述第一特征圖進行多次第二卷積運算包括:
第一次第二卷積運算之外的其他第二卷積運算中,均先對所述第一特征圖進行批標準化處理,再使用relu激活函數(shù)。
6.根據(jù)權(quán)利要求1所述的目標檢測方法,其特征在于,
根據(jù)所述第一預(yù)測圖對所述檢測網(wǎng)絡(luò)模型進行訓(xùn)練包括:
步驟A:根據(jù)所述第一預(yù)測圖、所述樣本圖像和所述第一損失函數(shù)計算第一損失函數(shù)值,并根據(jù)所述第二預(yù)測圖、所述樣本圖像和所述第二損失函數(shù)計算第二損失函數(shù)值;
步驟B:根據(jù)所述第一損失函數(shù)值和所述第二損失函數(shù)值計算所述檢測網(wǎng)絡(luò)模型的損失函數(shù)值;
步驟C:判斷所述損失函數(shù)值超過預(yù)設(shè)閾值,如果是,則調(diào)整所述檢測網(wǎng)絡(luò)模型中用于提取所述初始特征圖的模塊的參數(shù),如果不是,則結(jié)束所述檢測網(wǎng)絡(luò)模型的訓(xùn)練;
步驟D:采用調(diào)整參數(shù)后的檢測網(wǎng)絡(luò)模型提取所述樣本圖像的初始特征圖,對所述初始特征圖進行語義信息增強處理,以得到所述第一預(yù)測圖,并根據(jù)所述初始特征圖對所述樣本圖像進行預(yù)測,以得到所述第二預(yù)測圖;
重復(fù)執(zhí)行步驟A至步驟D,直至步驟C中判斷所述損失函數(shù)值未超過預(yù)設(shè)閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于展訊通信(上海)有限公司,未經(jīng)展訊通信(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011373448.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





