[發明專利]一種基于感知級聯上下文的車輛重識別方法有效
| 申請號: | 202011302398.6 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112381017B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 呂建明;莫晚成 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G06V20/54 | 分類號: | G06V20/54;G06V10/44;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 詹麗紅 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 感知 級聯 上下文 車輛 識別 方法 | ||
1.一種基于感知級聯上下文的車輛重識別方法,其特征在于,所述的車輛重識別方法包含以下步驟:
S1、構造車輛圖像的特征提取模型,所述的特征提取模型包括依次連接的主干網絡和分類網絡;
S2、將基于感知級聯上下文的注意力增強模塊嵌入到特征提取模型中;
S3、輸入車輛圖像數據集,對構建的特征提取模型進行訓練;
S4、采用經過訓練的特征提取模型進行車輛重識別任務;
其中,所述的主干網絡結構如下:
從輸入層至輸出層依次連接為:卷積層Conv2d-1、BN層BatchNorm2d-2、ReLU層ReLU-3、池化層MaxPool2d-4、卷積層Conv2d-5、BN層BatchNorm2d-6、ReLU層ReLU-7、卷積層Conv2d-8、BN層BatchNorm2d-9、ReLU層ReLU-10、卷積層Conv2d-11、BN層BatchNorm2d-12、卷積層Conv2d-13、BN層BatchNorm2d-14、ReLU層ReLU-15、Bottleneck層Bottleneck-16、卷積層Conv2d-17、BN層BatchNorm2d-18、ReLU層ReLU-19、卷積層Conv2d-20、BN層BatchNorm2d-21、ReLU層ReLU-22、卷積層Conv2d-23、BN層BatchNorm2d-24、ReLU層ReLU-25、Bottleneck層Bottleneck-26、卷積層Conv2d-27、BN層BatchNorm2d-28、ReLU層ReLU-29、卷積層Conv2d-30、BN層BatchNorm2d-31、ReLU層ReLU-32、卷積層Conv2d-33、BN層BatchNorm2d-34、ReLU層ReLU-35、Bottleneck層Bottleneck-36、卷積層Conv2d-37、BN層BatchNorm2d-38、ReLU層ReLU-39、卷積層Conv2d-40、BN層BatchNorm2d-41、ReLU層ReLU-42、卷積層Conv2d-43、BN層BatchNorm2d-44、卷積層Conv2d-45、BN層BatchNorm2d-46、ReLU層ReLU-47、Bottleneck層Bottleneck-48、卷積層Conv2d-49、BN層BatchNorm2d-50、ReLU層ReLU-51、卷積層Conv2d-52、BN層BatchNorm2d-53、ReLU層ReLU-54、卷積層Conv2d-55、BN層BatchNorm2d-56、ReLU層ReLU-57、Bottleneck層Bottleneck-58、卷積層Conv2d-59、BN層BatchNorm2d-60、ReLU層ReLU-61、卷積層Conv2d-62、BN層BatchNorm2d-63、ReLU層ReLU-64、卷積層Conv2d-65、BN層BatchNorm2d-66、ReLU層ReLU-67、Bottleneck層Bottleneck-68、卷積層Conv2d-69、BN層BatchNorm2d-70、ReLU層ReLU-71、卷積層Conv2d-72、BN層BatchNorm2d-73、ReLU層ReLU-74、卷積層Conv2d-75、BN層BatchNorm2d-76、ReLU層ReLU-77、Bottleneck層Bottleneck-78、卷積層Conv2d-79、BN層BatchNorm2d-80、ReLU層ReLU-81、卷積層Conv2d-82、BN層BatchNorm2d-83、ReLU層ReLU-84、卷積層Conv2d-85、BN層BatchNorm2d-86、卷積層Conv2d-87、BN層BatchNorm2d-88、ReLU層ReLU-89、Bottleneck層Bottleneck-90、卷積層Conv2d-91、BN層BatchNorm2d-92、ReLU層ReLU-93、卷積層Conv2d-94、BN層BatchNorm2d-95、ReLU層ReLU-96、卷積層Conv2d-97、BN層BatchNorm2d-98、ReLU層ReLU-99、Bottleneck層Bottleneck-100、卷積層Conv2d-101、BN層BatchNorm2d-102、ReLU層ReLU-103、卷積層Conv2d-104、BN層BatchNorm2d-105、ReLU層ReLU-106、卷積層Conv2d-107、BN層BatchNorm2d-108、ReLU層ReLU-109、Bottleneck層Bottleneck-110、卷積層Conv2d-111、BN層BatchNorm2d-112、ReLU層ReLU-113、卷積層Conv2d-114、BN層BatchNorm2d-115、ReLU層ReLU-116、卷積層Conv2d-117、BN層BatchNorm2d-118、ReLU層ReLU-119、Bottleneck層Bottleneck-120、卷積層Conv2d-121、BN層BatchNorm2d-122、ReLU層ReLU-123、卷積層Conv2d-124、BN層BatchNorm2d-125、ReLU層ReLU-126、卷積層Conv2d-127、BN層BatchNorm2d-128、ReLU層ReLU-129、Bottleneck層Bottleneck-130、卷積層Conv2d-131、BN層BatchNorm2d-132、ReLU層ReLU-133、卷積層Conv2d-134、BN層BatchNorm2d-135、ReLU層ReLU-136、卷積層Conv2d-137、BN層BatchNorm2d-138、ReLU層ReLU-139、Bottleneck層Bottleneck-140、卷積層Conv2d-141、BN層BatchNorm2d-142、ReLU層ReLU-143、卷積層Conv2d-144、BN層BatchNorm2d-145、ReLU層ReLU-146、卷積層Conv2d-147、BN層BatchNorm2d-148、卷積層Conv2d-149、BN層BatchNorm2d-150、ReLU層ReLU-151、Bottleneck層Bottleneck-152、卷積層Conv2d-153、BN層BatchNorm2d-154、ReLU層ReLU-155、卷積層Conv2d-156、BN層BatchNorm2d-157、ReLU層ReLU-158、卷積層Conv2d-159、BN層BatchNorm2d-160、ReLU層ReLU-161、Bottleneck層Bottleneck-162、卷積層Conv2d-163、BN層BatchNorm2d-164、ReLU層ReLU-165、卷積層Conv2d-166、BN層BatchNorm2d-167、ReLU層ReLU-168、卷積層Conv2d-169、BN層BatchNorm2d-170、ReLU層ReLU-171、Bottleneck層Bottleneck-172、批次難樣本三元組損失函數層triplet_loss;
其中,所述的步驟S2中構造基于感知級聯上下文的注意力增強模塊的過程如下:
S21、對于輸入到注意力增強模塊的圖像特征圖其中C、H、W分別代表該特征圖的通道數、特征圖高度、特征圖寬度,為了減少注意力增強模塊的計算量,通過一個狀態轉換矩陣Win將特征圖X的通道數壓縮為C′,得到特征圖其中Win的具體實現方式為一個1x1的卷積核,公式表達為:
X′=Win(X);
S22、對步驟S21得到的特征圖X′,輸入到下采樣層Pi進行下采樣以獲得多尺度的上下文特征圖其中Ni為特征圖下采樣后的尺度大小,公式表達為:
Xi=Pi(X′)
其中,Xi,i=1,2,…,N為一系列隱含了不同尺度特征信息的上下文特征圖X1,X2,…,XN;
S23、對于步驟S22得到的多尺度的上下文特征圖Xi,在每兩個相鄰尺度的上下文特征圖之間進行注意力加權計算,假設存在n個下采樣層,則需要進行n次注意力加權計算以獲得最終的注意力加權特征圖最終的注意力加權特征圖經過一個狀態轉換矩陣Wout將通道數恢復為與原特征圖一致,狀態轉換矩陣Wout的實現方式為一個1x1的卷積核,最后使用殘差連接將最終的注意力加權特征圖與原特征圖X進行融合,得到注意力加權結果特征圖Y,公式表達為:
S24、將構造的注意力增強模塊嵌入到特征提取模型的主干網絡中,具體位置分別為Bottleneck層Bottleneck-48、Bottleneck層Bottleneck-90、Bottleneck層Bottleneck-152、Bottleneck層Bottleneck-172之后,將上述層的輸出特征圖輸入到注意力增強模塊中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011302398.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種手部拉筋按摩機構及按摩椅
- 下一篇:一種緩沖啟動器





