[發(fā)明專利]一種基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法在審
| 申請?zhí)枺?/td> | 202011594833.7 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112749734A | 公開(公告)日: | 2021-05-04 |
| 發(fā)明(設(shè)計)人: | 張檣;石春雷;李斌 | 申請(專利權(quán))人: | 北京環(huán)境特性研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 中國航天科工集團公司專利中心 11024 | 代理人: | 張國虹 |
| 地址: | 100854 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 遷移 注意力 機制 領(lǐng)域 自適應(yīng) 目標 檢測 方法 | ||
1.一種基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,該方法包括以下步驟:
輸入源域圖片及目標域圖片;
通過主干網(wǎng)絡(luò)分別提取所述源域圖片的第一特征圖、所述目標域圖片的第二特征圖;
分別對所述第一特征圖及所述第二特征圖進行基于位置、通道的可遷移注意力的特征增強;
將增強后的特征輸入檢測頭,完成域自適應(yīng)的目標檢測。
2.根據(jù)權(quán)利要求1所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,所述第一特征圖、所述第二特征圖均為最頂層特征圖。
3.根據(jù)權(quán)利要求1所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,對所述第一特征圖及所述第二特征圖進行基于位置的可遷移注意力的特征增強,具體包括如下步驟:
為所述第一特征圖及所述第二特征圖中的K個區(qū)域分別訓練各自的第一域判別器;其中,每個所述第一域判別器負責匹配對應(yīng)區(qū)域中源域和目標域的數(shù)據(jù);
采用熵函數(shù)刻畫每一個所述區(qū)域的域分類的不確定性;
根據(jù)可遷移注意力將每一個所述區(qū)域分別進行加權(quán)后加入殘差路徑直接連接輸入和輸出,獲取增強后的特征。
4.根據(jù)權(quán)利要求3所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,所述K個區(qū)域的第一域判別器總體損失Lposition為:
式中,Ds代表源域,DT代表目標域,n表示源域和目標域的數(shù)據(jù)總數(shù),Gf代表特征提取器,fik=Gf(xi)k是第K個區(qū)域的特征表示,di是點xi的域標簽,Ld是域判別器的交叉熵損失函數(shù),k=1,2,…,K。
5.根據(jù)權(quán)利要求4所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,所述增強后的特征為:
式中,為位置注意力權(quán)重,為的熵函數(shù),為第i個圖片的第K個區(qū)域?qū)儆谠从虻母怕省?/p>
6.根據(jù)權(quán)利要求1所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,對所述第一特征圖及所述第二特征圖進行基于通道的可遷移注意力的特征增強,具體包括如下步驟:
對K個通道進行全局平均池化,獲得每一個通道特征總體的表示;
利用第二域判別器對所述每一個通道的特征進行分類,判斷所述每一個通道的特征的域;
依據(jù)所述第二域判別器輸出結(jié)果的熵刻畫該通道的可遷移性;
根據(jù)可遷移注意力將所述每一個通道分別進行加權(quán)后加入shortcut層,獲取增強后的特征。
7.根據(jù)權(quán)利要求6所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,所述K個通道的第二域判別器總體損失Lchannel為:
式中,Ds代表源域,DT代表目標域,n表示源域和目標域的數(shù)據(jù)總數(shù),nki為平均池化后的第i張圖片提取特征的第k個通道m(xù)ki,Di為點xi的域標簽,Lc為第二域判別器Gck的交叉熵損失函數(shù),k=1,2,…,K。
8.根據(jù)權(quán)利要求7所述的基于可遷移注意力機制的領(lǐng)域自適應(yīng)的目標檢測方法,其特征在于,所述增強后的特征為:
式中,為通道注意力權(quán)重,為的熵函數(shù),為第二域判別器Gck的輸出概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京環(huán)境特性研究所,未經(jīng)北京環(huán)境特性研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011594833.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





