[發(fā)明專(zhuān)利]一種基于多部件自注意力機(jī)制的行人重識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010467045.5 | 申請(qǐng)日: | 2020-05-28 |
| 公開(kāi)(公告)號(hào): | CN111368815B | 公開(kāi)(公告)日: | 2020-09-04 |
| 發(fā)明(設(shè)計(jì))人: | 陸易;葉喜勇;徐曉剛;張逸;張文廣;祝敏航 | 申請(qǐng)(專(zhuān)利權(quán))人: | 之江實(shí)驗(yàn)室 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專(zhuān)利事務(wù)所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310023 浙江省杭州市余*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 部件 注意力 機(jī)制 行人 識(shí)別 方法 | ||
1.一種基于多部件自注意力機(jī)制的行人重識(shí)別方法,其特征在于,包括以下步驟:
S1:預(yù)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)骨干模型B;
S2:對(duì)骨干模型B進(jìn)行分段:Bcommon和Bbranch,其中Bbranch對(duì)應(yīng)骨干模型B最后一層殘差網(wǎng)絡(luò)layer4,將Bbranch深度拷貝2份,得到三條支路:Bbranch1,Bbranch2,Bbranch3,在支路后構(gòu)建多部件自注意力網(wǎng)絡(luò)ANet,獲得行人的多部件自注意力特征F;
S3:將多部件自注意力特征輸入分類(lèi)器CLS,聯(lián)合訓(xùn)練最小化交叉熵?fù)p失Lxent和度量損失Ltriplet;
S4:將測(cè)試集圖片輸入訓(xùn)練好的模型,融合輸出的部件特征獲得整體特征f,經(jīng)度量排序?qū)崿F(xiàn)行人重識(shí)別。
所述的步驟S2包括以下子步驟:
S2.1:令Bcommon和Bbranch1,Bbranch2,Bbranch3對(duì)應(yīng)的學(xué)習(xí)參數(shù)為Wcommon和Wbranch1,Wbranch2,Wbranch3,Wbranch1,Wbranch2,Wbranch3的初始化參數(shù)一致;行人圖像P經(jīng)過(guò)Bcommon再分別經(jīng)過(guò)Bbranch1,Bbranch2,Bbranch3后,對(duì)應(yīng)提取到的特征圖分別為F1∈RC×H×W,F(xiàn)2∈RC×H×W,F(xiàn)3∈RC×H×W,其中,C為特征圖通道數(shù),H為特征圖的高,W為特征圖的寬,計(jì)算公式為:
其中,T表示矩陣轉(zhuǎn)置函數(shù);
S2.2:在Bbranch1后建立分支:基于局部部件的自注意力網(wǎng)絡(luò)PCPA;F1輸入PCPA,輸出特征集合Fpcpa,PCPA網(wǎng)絡(luò)參數(shù)為Wpcpa;
S2.3:在Bbranch2后建立分支:基于全局部件的自注意力網(wǎng)絡(luò)PCA;F2輸入PCA,輸出特征向量Fpca,PCA網(wǎng)絡(luò)參數(shù)為Wpca;
S2.4:在Bbranch3后建立分支:基于全局部件的特征映射網(wǎng)絡(luò)Global;F3輸入Global,輸出特征向量Fg,Global網(wǎng)絡(luò)參數(shù)為Wglobal;
S2.5:Fpcpa,F(xiàn)pca,F(xiàn)g共同組成多部件自注意力特征集合F。
所述步驟S2.2中的PCPA包括以下子步驟:
S2.2.1:對(duì)于F1∈RC×H×W,對(duì)其在高度上進(jìn)行水平平均分割,形成特征圖和
S2.2.2:對(duì)于輸入通過(guò)三條支路:特征映射模塊Identity,空間自注意力模塊PAtt,通道自注意力模塊CAtt;對(duì)應(yīng)地,提取到的特征圖分別為F1_up_identity,F(xiàn)1_up_patt,F(xiàn)1_up_catt,包括以下子步驟:
(a)對(duì)于輸入Identity映射關(guān)系的計(jì)算方式為:
F1_up_identity=F1_up
(b)對(duì)于輸入空間自注意力模塊PAtt具體為:對(duì)于任意的特征向量xi,xj∈F1_up,1≤i≤N,1≤j≤N,在空間尺度上對(duì)其進(jìn)行自注意力關(guān)系建模,得到關(guān)系矩陣D∈RN*N;對(duì)于D的每一個(gè)值dk,計(jì)算公式為:
將關(guān)系矩陣D作用于F1_up,并以殘差的形式融入網(wǎng)絡(luò),得到更新后的特征圖F1_up_patt,計(jì)算公式為:
其中,Wpatt為PAtt模塊的參數(shù),表示矩陣相乘;
(c)對(duì)于輸入通道自注意力模塊CAtt具體為:對(duì)于任意的特征向量ci,cj∈F1_up,1≤i≤C,1≤j≤C,在通道尺度上對(duì)其進(jìn)行自注意力關(guān)系建模,得到關(guān)系矩陣E∈RC*C;對(duì)于E的每一個(gè)值ek,計(jì)算公式為:
將關(guān)系矩陣E作用于與F1_up,得到更新后的特征圖F1_up_catt,計(jì)算公式為:
其中,Wcatt為CAtt模塊的參數(shù),表示矩陣相乘;
S2.2.3:把F1_up_identity,F(xiàn)1_up_patt,F(xiàn)1_up_catt進(jìn)行融合,得到輸出特征圖F1_up_pcpa,計(jì)算方式為:
F1_up_pcpa=F1_up_identity+F1_up_patt+F1_up_catt
S2.2.4:對(duì)于操作方式與F1_up一致,得到經(jīng)過(guò)PCPA的輸出特征圖F1_down_pcpa,且與F1_up共享參數(shù)Wpatt和Wcatt;
S2.2.5:對(duì)F1_up_pcpa和F1_down_pcpa進(jìn)行全局平均池化,得到特征向量集合:
Fpcpa={Fup_pcpa,F(xiàn)down_pcpa}
其中,F(xiàn)up_pcpa=AvgP(F1_up_pcpa),F(xiàn)down_pcpa=AvgP(F1_down_pcpa);AvgP(·)表示全局平均池化操作,計(jì)算公式為:
其中,xc,w,h為三維特征圖F1_up_pcpa的元素,1≤c≤C1,1≤w≤W1,1≤h≤H1,C1為F1_up_pcpa特征圖通道數(shù),W1為F1_up_pcpa特征圖的寬,H1為F1_up_pcpa特征圖的高;AvgP(F1_down_pcpa)同理。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于之江實(shí)驗(yàn)室,未經(jīng)之江實(shí)驗(yàn)室許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010467045.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于粒子濾波視覺(jué)注意力模型的運(yùn)動(dòng)目標(biāo)檢測(cè)方法
- 一種評(píng)測(cè)注意力狀態(tài)的方法及裝置
- 注意力測(cè)評(píng)方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 兒童注意力評(píng)估系統(tǒng)及其方法
- 一種注意力檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種注意力識(shí)別方法和裝置
- 一種可靠的用戶注意力監(jiān)測(cè)估計(jì)表示模型
- 注意力特征圖獲取方法及裝置、目標(biāo)檢測(cè)的方法及裝置
- 基于通道增強(qiáng)的雙注意力生成對(duì)抗網(wǎng)絡(luò)及圖像生成方法
- 一種文本情感分析模型的優(yōu)化方法及裝置
- 一種機(jī)制蛋的制造方法
- 手機(jī)制式的校準(zhǔn)方法、系統(tǒng)及手機(jī)檢測(cè)設(shè)備
- 一種考慮激勵(lì)機(jī)制電量電價(jià)彈性矩陣的耗電量估測(cè)方法
- 選擇區(qū)塊鏈共識(shí)機(jī)制的方法、裝置以及共識(shí)節(jié)點(diǎn)
- 一種復(fù)合改性機(jī)制砂及其制備方法
- 一種存儲(chǔ)設(shè)備糾錯(cuò)方法及糾錯(cuò)裝置
- 區(qū)塊鏈中共識(shí)機(jī)制的處理方法、裝置和電子設(shè)備
- 一種建筑用機(jī)制砂整形裝置
- 通信方法、通信裝置及存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)預(yù)約出租車(chē)市場(chǎng)準(zhǔn)入機(jī)制的優(yōu)化方法及系統(tǒng)





