[發明專利]一種基于注意力機制的遙感圖像目標檢測方法有效
| 申請號: | 201910457637.6 | 申請日: | 2019-05-29 |
| 公開(公告)號: | CN110276269B | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 時光;劉軍民;郭保民;張講社;周長勝;劉洋;陳琨;陳姝璇;張博文 | 申請(專利權)人: | 西安交通大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 范巍 |
| 地址: | 710049 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 遙感 圖像 目標 檢測 方法 | ||
1.一種基于注意力機制的遙感圖像目標檢測方法,其特征在于,包括以下步驟:
步驟1,對數據集進行增強處理,得到增強后的數據集;
步驟2,構建基于注意力機制的目標檢測模型,并通過步驟1中得到的增強后的數據集訓練該目標檢測模型,直至達到相應的停止條件;
其中,步驟2中,構建基于注意力機制的目標檢測模型的具體方法是:
在YOLOv3模型的特征融合層中加入了位置嵌入層和注意力層,得到基于注意力機制的目標檢測模型;
向特征融合層中加入位置嵌入層的具體方法是:
利用下式將特征融合層的特征圖Xl與位置嵌入相加,得到融入了位置信息的特征圖
其中,Xl為第l個特征融合層的特征圖;為特征嵌入矩陣;的初始像素值與Xl的像素值相等。
2.根據權利要求1所述的一種基于注意力機制的遙感圖像目標檢測方法,其特征在于,步驟1中,增強處理包括隨機旋轉變換和隨機尺度變換,具體地,對數據集進行隨機旋轉變換的具體方法是:
首先對數據集進行90°旋轉變換、180°旋轉變換、270°旋轉變換、上下翻轉變換或左右翻轉變換,之后對數據集中經過變換后的目標圖像的真實邊界框坐標進行變換;
隨機尺度變換包括對訓練圖像進行隨機縮放變換和隨機寬高比變換。
3.根據權利要求2所述的一種基于注意力機制的遙感圖像目標檢測方法,其特征在于,設定數據集中的目標圖像的原始真實邊界框的左上角坐標為(x1,y1)、右下角坐標為(x2,y2);則經過90°旋轉變換后的該目標圖像的邊界框的左上角坐標為(y1,w-x2)、右下角坐標為(y2,h-x1);經過180°旋轉變換后的圖像的該目標圖像的真實邊界框的左上角坐標為(w-x2,h-y2)、右下角坐標為(w-x1,h-y1);經過270°旋轉變換后的該目標圖像的真實邊界框的左上角坐標為(h-y2,x1)、右下角坐標為(h-y1,x2);經過左右翻轉變換后的該目標圖像的真實邊界框的左上角坐標為(w-x2,y1)、右下角坐標為(w-x1,y2);經過上下翻轉變換后的該目標圖像的真實邊界框的左上角坐標均為(x1,h-y2)、右下角坐標均為(x2,h-y1)。
4.根據權利要求1所述的一種基于注意力機制的遙感圖像目標檢測方法,其特征在于,向特征融合層中加入注意力層的具體方法是,將融入了位置信息的特征圖的每個位置使用注意力機制融合編碼為具體地:
S1,將融入了位置信息的特征圖的每個位置線性映射為三個不同的向量公式為:
其中,WQ,WK,WV為可學習的變換矩陣,×表示矩陣乘法,(i,j)表示融入了位置信息的特征圖中每一個位置的坐標;
S2,利用S1中得到的變換向量構建注意力機制的加權系數其公式為:
其中,·表示點積,(k,l)融入了位置信息的特征圖中每一個位置的坐標;
S3,利用S1中得到的變換向量和S2中得到的加權系數結合下式得到注意力機制的編碼特征圖
S4,將S3中得到的注意力機制的編碼特征圖與特征融合層的特征圖Xl串聯,作為注意力層的輸出。
5.根據權利要求1所述的一種基于注意力機制的遙感圖像目標檢測方法,其特征在于,步驟2中,將步驟1中得到的增強后的數據集與隨機梯度下降法相結合,訓練得到的基于注意力機制的目標檢測模型,直至達到相應的停止條件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安交通大學,未經西安交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910457637.6/1.html,轉載請聲明來源鉆瓜專利網。





