[發明專利]一種基于注意力機制的無錨框行人搜索方法在審
| 申請號: | 202210878732.5 | 申請日: | 2022-07-25 |
| 公開(公告)號: | CN115359510A | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 彭波;付寶印;路錦正;李強;賈盼蓉;劉起源 | 申請(專利權)人: | 西南科技大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/82;G06V10/80;G06V10/774;G06V10/764;G06V10/74;G06N3/04;G06N3/08 |
| 代理公司: | 成都正德明志知識產權代理有限公司 51360 | 代理人: | 雷正 |
| 地址: | 621010 四川*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 無錨框 行人 搜索 方法 | ||
本發明公開了一種基于注意力機制的無錨框行人搜索方法,包括以下步驟:S1、選擇PRW數據集作為訓練樣本;S2、構建一個基于注意力機制的無錨框的行人搜索網絡;S3、將訓練樣本傳輸至基于注意力機制的無錨框的行人搜索網絡,將損失反向傳播,重復本步驟直至訓練結束;S4、對訓練后的基于注意力機制的無錨框的行人搜索網絡進行驗證,若行人搜索準確率低于設定準確率,則返回步驟S3;否則進入步驟S5;S5、采用訓練后的基于注意力機制的無錨框的行人搜索網絡進行無錨框行人搜索。與現有技術相比,本發明的網絡結構設計簡潔,推理速度快,提高了行人搜索的精度,使用了隨機擦除的數據增強策略,能更好的應對遮擋的情況。
技術領域
本發明涉及計算機視覺應用技術領域,具體包括一種基于注意力機制的無錨框行人搜索方法。
背景技術
隨著視頻監控設備的普及,帶來了無數的視頻監控數據。如何利用視頻監控數據,讓視頻監控更好的為人所用這個一個重大問題。在視頻監控檢索方面目前最廣泛的是人工檢索,這種方式效率比較低,而且檢索工作枯燥乏味。
視頻監控常常是視覺條件不好的情況,不能拍攝到整個人,或者一個人的圖像過于小,這時候人臉識別便無能為力。行人重識別應運而生,行人重識別的是指在已經識別出人的基礎上來識別人的身份。行人重識別常常利用人的衣著體型等特征,然后計算特征相似性以此判斷是否是同一人,這種工作方式和人工檢索相類似。但是行人重識別有一個很重要的前提條件那就是必須先把人檢測出來,也就說行人重識別的數據都是從全景圖像中裁剪出來的。那么從完整的視頻圖像中完成重識別就要分兩步,第一步要完成行人檢測,第二部完成行人重識別。兩步就需要兩個網絡去實現,這大大提高的計算量。
行人搜索是指將行人檢測和行人重識別在一個網絡中去完成。通常,行人搜索網絡都是在目標檢測的網絡上增加分支作為重識別的輸出。根據目標檢測網絡的不同,可分基于一階段目標檢測的行人搜索網絡,和基于二階段目標檢測的行人搜索網絡。一階段二階段的區別在于預設框的來源,一階段由人為指定,二階段通過學習來得到。因此一階段網絡更加快速,二階段網絡更加準確。無錨框網絡是一階段網絡的一種特殊形式,在網絡中不指定預設框。有錨框網絡的最終預測結果的是預設框的微調,比如將預設框向左移動5個像素點,而無錨框網絡通過錨點直接預測框,比如框的左右邊界距離錨點10個像素點。無錨框網絡由于沒有過多的預設框,從而參數量和計算量大大減少。
現有的行人搜索方式都是基于二階段目標檢測改進的,基本都是以FasterRCNN為主體結構。Seq直接在完整的目標檢測網絡后重復疊加一個目標檢測預測頭與一個重識別頭部,雖然精度提高了但是計算量顯著增大,網絡結構十分臃腫。
發明內容
針對現有技術中的上述不足,本發明提供的一種基于注意力機制的無錨框行人搜索方法解決了現有技術中行人搜索計算量大、網絡結構臃腫的問題。
為了達到上述發明目的,本發明采用的技術方案為:一種基于注意力機制的無錨框行人搜索方法,包括以下步驟:S1、選擇PRW數據集作為訓練樣本;
S2、使用改進的resnet50網絡作為主干網絡,構建一個基于注意力機制的無錨框的行人搜索網絡;
S3、將訓練樣本傳輸至基于注意力機制的無錨框的行人搜索網絡,根據標簽值和損失函數計算損失,將損失反向傳播,重復本步驟直至訓練結束;
S4、對訓練后的基于注意力機制的無錨框的行人搜索網絡進行驗證,若行人搜索準確率低于設定準確率,則返回步驟S3;否則進入步驟S5;
S5、采用訓練后的基于注意力機制的無錨框的行人搜索網絡進行無錨框行人搜索。
進一步地,所述基于注意力機制的無錨框的行人搜索網絡包括基于注意力機制的主干網絡、改進后的特征融合頸部、目標檢測頭部和重識別頭部;基于注意力機制的主干網絡的輸出端和改進后的特征融合頸部的輸入端相連接;改進后的特征融合頸部的輸出端分別和目標檢測頭部、重識別頭部的輸入端相連接;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南科技大學,未經西南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210878732.5/2.html,轉載請聲明來源鉆瓜專利網。





