[發明專利]基于全局區域先驗注意力的目標檢測方法有效
| 申請號: | 202011365545.4 | 申請日: | 2020-11-28 |
| 公開(公告)號: | CN112381106B | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 吳澤彬;龔航;徐偉;趙朝蓬;劉建新;陳圣堂;徐洋;陳剛;夏雷;顧濤;丁道華;晁京 | 申請(專利權)人: | 南京理工大學;中國鐵路上海局集團有限公司南京供電段 |
| 主分類號: | G06V10/44 | 分類號: | G06V10/44;G06V10/82;G06N3/04;G06N3/08;G06T3/40 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 陳鵬 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 全局 區域 先驗 注意力 目標 檢測 方法 | ||
1.一種基于全局區域先驗注意力的目標檢測方法,其特征在于,包括如下步驟:
步驟(A),遍歷訓練集,統計每個訓練樣本中目標出現的位置信息,得到全局區域先驗注意力;
步驟(B),獲取待檢測圖像,利用訓練得到的特征提取網絡對原圖進行特征提取;
步驟(C),從主干網絡中分支出自適應注意力網絡分支,利用自適應注意力網絡對全局區域先驗注意力進行修正與增強,得到自適應全局區域先驗注意力掩膜;將注意力掩膜點乘到特征圖上,然后對特征圖進行目標檢測;
步驟(C)包括如下步驟:
(C1),從主干特征提取網絡中的特征中提取特征作為全局區域先驗注意力修正增強網絡的輸入;
(C2),將輸入特征進行卷積、池化、反卷積獲得更加抽象的語義信息;
(C3),將步驟(C2)的計算結果過一層sigmoid函數進行歸一化,然后乘上全局區域先驗注意力,對全局區域先驗注意力進行增強與修正;
(C4),在步驟(C3)的計算結果上加上1,然后點乘到主干特征提取網絡的特征上,對特征進行增強;其計算公式如下:
其中x為輸入的特征,為卷積、池化、反卷積系列計算,為區域先驗注意力,點乘上注意力修正增強網絡中產生的掩膜,對區域先驗注意力進行修正增強,在所有元素上加上1,最后點成到特征圖上,對特征圖進行增強,然后對特征圖進行目標檢測。
2.根據權利要求1所述的基于全局區域先驗注意力的目標檢測方法,其特征在于,步驟(A),遍歷訓練集,統計每個訓練樣本中目標出現的位置信息,得到全局區域先驗注意力,包括如下步驟:
(A1),在訓練樣本圖片中人工框選出目標所在的區域,獲取訓練樣本圖片中目標所在的目標區域的位置信息作為標簽保存;
(A2),將訓練樣本圖片與全局區域先驗注意力縮放至所設定的尺寸;
(A3),初始化全局區域先驗注意力每個值為零,遍歷訓練樣本,將全局區域先驗注意力中所有與訓練樣本圖片的標簽中所劃定的區域同一位置的像素的像素值加1,得到全局區域先驗注意力;
(A4),使用sigmoid函數對全局區域先驗注意力進行歸一化,得到全局區域先驗注意力。
3.根據權利要求1所述的基于全局區域先驗注意力的目標檢測方法,其特點在于,所述步驟(B),獲取待檢測圖像,利用訓練得到的特征提取網絡對原圖進行特征提取,包括如下步驟:
(B1),使用雙線性插值的方法將待檢測圖片縮放到同一個尺寸大小;
(B2),使用3*3的卷積核與1*1的卷積核,將輸入值進行特征提取,最后生成13*13的多維矩陣,這將原圖分割成13*13個網格,13*13共169個n維向量負責每個網格內的目標檢測,其中包括分類信息,目標位置信息;
(B3),將訓練樣本中的標簽信息處理成與網絡輸出對應的矩陣形式,并計算損失值,然后使用反向傳播訓練整個網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學;中國鐵路上海局集團有限公司南京供電段,未經南京理工大學;中國鐵路上海局集團有限公司南京供電段許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011365545.4/1.html,轉載請聲明來源鉆瓜專利網。





