[發明專利]一種應用于邊緣設備的高效實時目標檢測方法在審
| 申請號: | 202210559139.4 | 申請日: | 2022-05-22 |
| 公開(公告)號: | CN114821112A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 程茂凱;陳金令;徐紫涵 | 申請(專利權)人: | 西南石油大學 |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/26;G06V10/764;G06V10/82;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610500 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 應用于 邊緣 設備 高效 實時 目標 檢測 方法 | ||
1.一種應用于邊緣設備的高效實時目標檢測方法,其特征在于,包括以下步驟:
S1:使用攝像頭獲取目標物體的圖片信息,然后進行圖像預處理;
S2:通過改進的卷積神經網絡對獲取的目標圖像進行特征提取;
S3:將步驟S2中獲取的圖像特征通過原始圖像特征收集與再分配模塊進行圖像融合再分配;
S4:將步驟S3步驟中所得權重再經過CAS-PAN進行圖像融合;
S5:將最終獲得的權重再head部分進行分類和回歸,最后生成符合目標大小的檢測框,最終獲得目標位置和目標信息;
S6:將上述步驟移植到邊緣設備上,加速后即可進行實施目標檢測。
2.如權利要求1中所述的一種應用于邊緣設備的高效實時目標檢測方法,其特征在于,所述步驟S1具體為:
將輸入圖像轉換為矩陣形式,若CNN的輸入是彩色圖像,則輸入層表示為分別為彩色圖像R、G、B三個通道的數據;
再進行圖像的預處理,首先將圖片拆減為640×640大小,在經過圖像縮放和旋轉變換:
將最終處理結果輸入到改進的卷積神經網絡中進行特征提取。
3.如權利要求1中所述的一種應用于邊緣設備的高效實時目標檢測方法,其特征在于,所述步驟S2具體為:
特征提取的主干網絡主要基于ResNet50網絡進行的改進;網絡中包含了卷積層、非線性激活函數、殘差模塊以及多頭注意力模塊:
卷積層的作用是提取輸入圖片中的信息,這些信息被稱為圖像特征,這些特征是由圖像中的每個像素通過組合或者獨立的方式所體現,比如圖片的紋理特征,顏色特征:
N=(W-F+2P)÷(S+1)
其中N為:輸出大小,W為:輸入大小,F為:卷積核大小,P為:填充值的大小,S:步長大小;
非線性激活函數使用的是ELU激活函數:
其中,x為:輸入值,Q為一個可學習的參數;
殘差模塊可以理解為以al作為輸入經過線性變化:
Z[l+1]=W[l+1]al+b[l+1]
然后使用上述非線性激活函數進行非線性變換:
a[l+1]=δ(z[l+1])
同樣,將a[l+1]進行線性變化到下一層:
Z[l+2]=W[l+2]a[l+1]+b[l+2]
依次類推進行多個殘差模塊的疊加,以獲取圖片的跟多特征信息;
多頭注意力模塊是使用了Transformer中的多頭注意力機制,穿差進最后一個子層中將原有的3×3卷積替換為MHSA多頭注意力模塊:
Attention(q,k,v,r)=softmax(qkT+qrT)v
其中q、k、r、v分別表示查詢、鍵、位置編碼(這里使用是相對位置編碼)和數值。加法和乘法分別表示為元素求和與矩陣乘法,1×1則表示逐點卷積。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西南石油大學,未經西南石油大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210559139.4/1.html,轉載請聲明來源鉆瓜專利網。





