[發(fā)明專利]一種基于主體區(qū)域引導(dǎo)的偽裝目標(biāo)檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 202211037831.7 | 申請(qǐng)日: | 2022-08-25 |
| 公開(公告)號(hào): | CN115346094B | 公開(公告)日: | 2023-08-22 |
| 發(fā)明(設(shè)計(jì))人: | 吳智聰;周曉飛;張繼勇;李世鋒;周振;何帆 | 申請(qǐng)(專利權(quán))人: | 杭州電子科技大學(xué);中電數(shù)據(jù)服務(wù)有限公司 |
| 主分類號(hào): | G06V10/80 | 分類號(hào): | G06V10/80;G06V10/82;G06V10/774;G06N3/0464;G06N3/09 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310018 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 主體 區(qū)域 引導(dǎo) 偽裝 目標(biāo) 檢測(cè) 方法 | ||
1.一種基于主體區(qū)域引導(dǎo)的偽裝目標(biāo)檢測(cè)方法,其特征在于:包括以下步驟:
步驟一、訓(xùn)練圖像預(yù)處理:訓(xùn)練數(shù)據(jù)集采用COD10K數(shù)據(jù)集和CAMO數(shù)據(jù)集,對(duì)輸入訓(xùn)練圖像進(jìn)行隨機(jī)翻轉(zhuǎn)與隨機(jī)裁剪操作,并使用距離變化算法生成主體區(qū)域的標(biāo)簽圖,用作后續(xù)網(wǎng)絡(luò)訓(xùn)練時(shí)的監(jiān)督標(biāo)簽;
步驟二、偽裝目標(biāo)預(yù)測(cè)網(wǎng)絡(luò)搭建:偽裝目標(biāo)預(yù)測(cè)網(wǎng)絡(luò)采用Encoder-Decoder結(jié)構(gòu),包括基于Res2Net-50主干網(wǎng)絡(luò)的編碼部分、包含主體區(qū)域分析模塊、特征融合模塊的解碼部分以及預(yù)測(cè)監(jiān)督部分;
在編碼部分,將經(jīng)過圖像預(yù)處理后的圖像輸入Res2Net-50的主干網(wǎng)絡(luò),得到通道數(shù)和尺寸不同的各編碼層級(jí)卷積特征圖,將各編碼層級(jí)卷積特征圖各輸入一個(gè)卷積塊進(jìn)行通道維度的壓縮,壓縮后將通道數(shù)相同的各層級(jí)特征圖傳遞至解碼部分;
IFi=ReLU(BN(Conv1+3(Encoderi)))
其中,Encoderi表示第i層級(jí)編碼塊的特征圖,IFi表示第i層級(jí)編碼塊壓縮后的特征圖,Conv1+3()表示一個(gè)1×1的卷積層和一個(gè)3×3的卷積層,BN()表示批量歸一化操作,ReLU()表示ReLU激活函數(shù),壓縮后將通道數(shù)相同的各層級(jí)特征圖傳遞至解碼部分;
在解碼部分,網(wǎng)絡(luò)主要包含主體區(qū)域分析模塊和特征融合模塊,主體區(qū)域分析模塊接收到編碼部分輸出的卷積特征圖和上一層級(jí)特征融合模塊輸出的特征圖,通過殘差融合的方式預(yù)測(cè)偽裝目標(biāo)的主體區(qū)域,定義為:
其中,PFi-1表示第i-1層級(jí)特征融合模塊輸出的特征圖,BFi表示第i層級(jí)主體區(qū)域預(yù)測(cè)模塊輸出的特征圖,Conv3()表示3×3的卷積層,UP()表示雙線性插值上采樣操作,Cat()表示級(jí)聯(lián)操作,每一個(gè)卷積層后都包含批量歸一化操作和ReLU激活函數(shù);
特征融合模塊接收到主體區(qū)域分析模塊輸出的特征圖,采用自注意力的方式實(shí)現(xiàn)特征融合,進(jìn)行偽裝目標(biāo)的準(zhǔn)確預(yù)測(cè),定義為:
PFi=SA(Conv3(BFi)))
其中,SA()表示自注意力操作,并且在卷積層后包含批量歸一化操作和ReLU激活函數(shù);
最后在預(yù)測(cè)監(jiān)督部分,將解碼部分主體區(qū)域分析模塊和特征融合模塊輸出的特征圖輸入卷積層,并使用上采樣和Softmax操作得到最終的預(yù)測(cè)圖序列;
步驟三、偽裝目標(biāo)預(yù)測(cè)網(wǎng)絡(luò)的訓(xùn)練:網(wǎng)絡(luò)的預(yù)測(cè)監(jiān)督部分輸出包含5張主體區(qū)域預(yù)測(cè)圖和5張偽裝目標(biāo)預(yù)測(cè)圖的序列,使用主體區(qū)域標(biāo)簽圖和目標(biāo)標(biāo)簽圖進(jìn)行監(jiān)督訓(xùn)練,其中主體區(qū)域預(yù)測(cè)圖和標(biāo)簽圖的監(jiān)督采用BCE損失函數(shù),而偽裝目標(biāo)預(yù)測(cè)圖和標(biāo)簽圖的監(jiān)督采用BCE和IOU的混合損失函數(shù),
網(wǎng)絡(luò)采用階梯衰減的學(xué)習(xí)率策略,初始學(xué)習(xí)率和衰減系數(shù)分別為0.0001和0.5,批處理參數(shù)設(shè)置為8;網(wǎng)絡(luò)使用隨機(jī)梯度下降算法進(jìn)行優(yōu)化,動(dòng)量系數(shù)設(shè)置為0.9。
2.根據(jù)權(quán)利要求1所述的一種基于主體區(qū)域引導(dǎo)的偽裝目標(biāo)檢測(cè)方法,其特征在于:所述步驟三具體包括:
主體區(qū)域預(yù)測(cè)圖和標(biāo)簽圖的監(jiān)督采用BCE損失函數(shù),而偽裝目標(biāo)預(yù)測(cè)圖和標(biāo)簽圖的監(jiān)督采用BCE和IOU的混合損失函數(shù),定義為:
其中,BPi表示第i層級(jí)主體區(qū)域分析模塊對(duì)應(yīng)預(yù)測(cè)監(jiān)督部分輸出的主體區(qū)域預(yù)測(cè)圖,CPi表示第i層級(jí)特征融合模塊對(duì)應(yīng)預(yù)測(cè)監(jiān)督部分輸出的偽裝目標(biāo)預(yù)測(cè)圖,BL和GT分別表示主體區(qū)域標(biāo)簽圖和目標(biāo)標(biāo)簽圖,LossBCE()表示BCE損失函數(shù),LossBCE+IOU()表示BCE和IOU的混合損失函數(shù),Loss表示合計(jì)損失值。
3.根據(jù)權(quán)利要求1所述的一種基于主體區(qū)域引導(dǎo)的偽裝目標(biāo)檢測(cè)方法,其特征在于:所述主體區(qū)域分析模塊使用殘差連接的方式,利用編碼部分輸出的卷積特征圖和上一層級(jí)特征融合模塊輸出的特征圖,進(jìn)行主體區(qū)域預(yù)測(cè)。
4.根據(jù)權(quán)利要求1所述的一種基于主體區(qū)域引導(dǎo)的偽裝目標(biāo)檢測(cè)方法,其特征在于:所述特征融合模塊接收到主體區(qū)域分析模塊輸出的特征圖,采用自注意力的方式實(shí)現(xiàn)特征融合,進(jìn)行偽裝目標(biāo)的預(yù)測(cè)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué);中電數(shù)據(jù)服務(wù)有限公司,未經(jīng)杭州電子科技大學(xué);中電數(shù)據(jù)服務(wù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211037831.7/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 引導(dǎo)裝置及引導(dǎo)方法
- 引導(dǎo)系統(tǒng)以及引導(dǎo)方法
- 引導(dǎo)裝置、引導(dǎo)方法以及引導(dǎo)程序
- 車輛引導(dǎo)裝置、車輛引導(dǎo)方法和車輛引導(dǎo)程序
- 移動(dòng)引導(dǎo)系統(tǒng)、移動(dòng)引導(dǎo)裝置、以及移動(dòng)引導(dǎo)方法
- 引導(dǎo)裝置、引導(dǎo)方法以及引導(dǎo)程序
- 路徑引導(dǎo)裝置、路徑引導(dǎo)方法以及路徑引導(dǎo)程序
- 引導(dǎo)方法及引導(dǎo)系統(tǒng)
- 引導(dǎo)裝置、引導(dǎo)方法以及引導(dǎo)程序
- 引導(dǎo)系統(tǒng)、引導(dǎo)裝置和引導(dǎo)系統(tǒng)的控制方法





