[發明專利]一種基于注意力機制的無錨框行人搜索方法在審
| 申請號: | 202210878732.5 | 申請日: | 2022-07-25 |
| 公開(公告)號: | CN115359510A | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 彭波;付寶印;路錦正;李強;賈盼蓉;劉起源 | 申請(專利權)人: | 西南科技大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/82;G06V10/80;G06V10/774;G06V10/764;G06V10/74;G06N3/04;G06N3/08 |
| 代理公司: | 成都正德明志知識產權代理有限公司 51360 | 代理人: | 雷正 |
| 地址: | 621010 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 無錨框 行人 搜索 方法 | ||
1.一種基于注意力機制的無錨框行人搜索方法,其特征在于,包括以下步驟:
S1、選擇PRW數據集作為訓練樣本;
S2、使用改進的resnet50網絡作為主干網絡,構建一個基于注意力機制的無錨框的行人搜索網絡;
S3、將訓練樣本傳輸至無基于注意力機制的錨框的行人搜索網絡,根據標簽值和損失函數計算損失,將損失反向傳播,重復本步驟直至訓練結束;
S4、對訓練后的基于注意力機制的無錨框的行人搜索網絡進行驗證,若行人搜索準確率低于設定準確率,則返回步驟S3;否則進入步驟S5;
S5、采用訓練后的基于注意力機制無錨框的行人搜索網絡進行行人搜索。
2.根據權利要求1所述的一種基于注意力機制的無錨框行人搜索方法,其特征在于,所述基于注意力機制的無錨框的行人搜索網絡包括基于注意力機制的主干網絡、改進后的特征融合頸部、目標檢測頭部和重識別頭部;基于注意力機制的主干網絡的輸出端和改進后的特征融合頸部的輸入端相連接;改進后的特征融合頸部的輸出端分別和目標檢測頭部、重識別頭部的輸入端相連接;
基于注意力機制的主干網絡的構建方法為:在resnet50網絡的基礎上,將第二個階段的卷積層更換為可變形卷積,在第二個階段后的三個階段的每一個瓶頸結構的第三個卷積層后添加注意力機制;
改進后的特征融合頸部的構建方法為:將特征融合頸部中的橫向卷積層和特征聚合卷積層都替換為可變形卷積,對自上而下融合時的各層級的特征進行通道拼接積;
目標檢測頭部,用于進一步提取改進后的特征融合頸部的特征,輸出類別和預測框;
重識別頭部,將改進后的特征融合頸部輸出特征歸一化,輸出重識別特征。
3.根據權利要求2所述的一種基于注意力機制的無錨框行人搜索方法,其特征在于,目標檢測頭部包含兩個子模塊:
分類子模塊,用于對改進后的特征融合頸部的每一層輸出依次做4次3*3卷積和一次1*1卷積,得到1通道的分類結果,即得到訓練樣本是人的概率;其中最后一次3*3卷積使用可變形卷積;
回歸子模塊,用于對改進后的特征融合頸部的每一層輸出做4次3*3卷積,得到4通道的回歸結果,分別對應4個邊框與錨點的距離;其中最后一次卷積使用可變形卷積;
分類子模塊的輸入端、回歸子模塊的輸出端和重識別頭部的輸入端相連接;
基于注意力機制的無錨框行人搜索網絡最終輸出261維度的特征向量;其中,1維是行人檢測分類得分,4維表示行人的預測框,剩下256維是該行人的重識別特征;目標檢測頭部的輸出端和重識別頭部的輸入端相連接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南科技大學,未經西南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210878732.5/1.html,轉載請聲明來源鉆瓜專利網。





