[發明專利]基于改進的交叉熵損失函數的遙感圖像目標檢測方法有效
| 申請號: | 202011462894.8 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112528862B | 公開(公告)日: | 2023-02-10 |
| 發明(設計)人: | 李陽陽;史雯熙;何愛媛;焦李成;尚榮華;馬文萍;李玲玲 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06V20/10 | 分類號: | G06V20/10;G06V10/25;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 陳宏社;李勇軍 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 改進 交叉 損失 函數 遙感 圖像 目標 檢測 方法 | ||
1.一種基于改進的交叉熵損失函數的遙感圖像目標檢測方法,其特征在于,包括如下步驟:
(1)獲取訓練樣本集和測試樣本集:
從遙感圖像數據集中獲取包含C種目標類別共N幅帶標簽的遙感圖像,每幅遙感圖像至少包含一個目標,并對每個目標類別進行獨熱編碼,將真實的目標類別編碼為1,其他的目標類別編碼為0;并將N幅帶標簽的遙感圖像中的m幅圖像作為訓練樣本集,將其余帶標簽的遙感圖像作為測試樣本集,C≥2,N≥200,
(2)構建基于改進的交叉熵損失函數的遙感圖像目標檢測模型:
(2a)構建基于Faster R-CNN的遙感圖像目標檢測模型:
構建包括依次級聯的特征提取子網絡、區域生成子網絡、ROI Align池化層和分類定位子網絡;其中,特征提取子網絡包括多個級聯的特征提取模塊,每個特征提取模塊包含依次連接的多個卷積層-ReLU層和一個最大池化層;區域生成子網絡包括依次連接的卷積層-ReLU層、并行連接的第一分類子網絡和包含一個卷積層的第一定位模塊、proposal層;第一分類子網絡包括依次連接的卷積層、reshape層、softmax層、reshape層;分類定位子網絡包括依次連接的全連接層、并行連接的第二分類子網絡和包含一個全連接層的第二定位模塊,第二分類子網絡包括級聯的全連接層和softmax層;
(2b)定義改進的交叉熵損失函數FL:
FL=FLcls1(pi)+Lreg1(d1'i,d1i)+FLcls2(pc)+Lreg2(d'2k,d2k)
FLcls1(pi)=-(1-pi)γlog(pi),i∈I
FLcls2(pc)=-(1-pc)γlog(pc),c∈C
其中,FLcls1(pi)表示第一分類子網絡的改進的交叉熵損失函數,Lreg1(d’1i,d1i)表示第一定位模塊的損失函數,FLcls2(pc)表示第二分類子網絡的改進的交叉熵損失函數,Lreg2(d'2k,d2k)表示第二定位模塊的損失函數;pi表示在FLcls1(pi)中由第一分類子網絡生成并篩選的第i個候選框A1i中的內容為目標的概率,i∈I,I為A1i的個數;pc表示在FLcls2(pc)中由第二分類子網絡中第k個候選框A2k中的目標為第c類的概率,c∈C,k∈K,K為非極大值抑制中設置的候選框個數,K≤I;(1-pi)γ和(1-pc)γ表示調制因子,γ表示指數參數;d’1i表示A1i的預測偏移量,d’1i=[d’1ix,d’1iy,d’1iw,d’1ih],d’1ix和d’1iy分別表示A1i的中心位置坐標在x軸和y軸的預測偏移量,d’1iw和d’1ih分別表示A1i在寬和高上的預測偏移量;A1i=[A1ix,A1iy,A1iw,A1ih],A1ix和A1iy分別表示A1i的中心位置坐標在x軸和y軸的值,A1iw和A1ih分別表示A1i的寬和高;d1i表示A1i的真實偏移量,d1i=[d1ix,d1iy,d1iw,d1ih],d1ix和d1iy分別表示A1i的中心位置坐標在x軸和y軸的真實偏移量,d1iw和d1ih分別表示A1i在寬和高上的真實偏移量;d'2k表示A2k的預測偏移量,d'2k=[d'2kx,d'2ky,d'2kw,d'2kh],d'2kx和d'2ky分別表示A2k的中心位置坐標在x軸和y軸的預測偏移量,d'2kw和d'2kh分別表示A2k在寬和高上的預測偏移量;A2k=[A2kx,A2ky,A2kw,A2kh],A2kx和A2ky分別表示A2k的中心位置坐標在x軸和y軸的值,A2kw和A2kh分別表示A2k的寬和高;d2k表示A2k的真實偏移量;d2k=[d2kx,d2ky,d2kw,d2kh],d2kx和d2ky分別表示A2k中心位置坐標在x軸和y軸的真實偏移量,d2kw和d2kh分別表示A2k在寬和高上的真實偏移量;smoothL1(x)為平滑損失函數;
(3)對基于改進的交叉熵損失函數的遙感圖像目標檢測模型進行迭代訓練:
(3a)初始化基于Faster R-CNN的遙感圖像目標檢測模型的網絡參數θ,迭代次數為t,最大迭代次數為T,T=20,并令t=0;
(3b)將訓練樣本集作為遙感圖像目標檢測模型的輸入進行前向傳播,特征提取子網絡對每個訓練樣本進行特征提取,得到特征圖集合f={f1,f2,...,fq,...,fm},其中fq表示第q個訓練樣本對應的大小為a×b的特征圖,q∈m,每個特征圖中的每個像素點對應訓練樣本中的一個區域;
(3c)區域生成子網絡生成預測候選框坐標:
(3c1)以fq中每個像素點為中心,生成該像素點的9種初始候選框,得到fq的9×a×b個初始候選框,并計算每個初始候選框A0i與每個真實框Gr之間的交集與并集的比值IoU,Gr表示第r個真實框,r∈R,R表示真實框的個數,R≤I,再根據IoU對所有初始候選框進行篩選,將所篩選的多個初始候選框作為候選框A1i,篩選規則為:當IoU>0.7時,初始候選框包含有目標,標記為1;當IoU<0.3時,初始候選框不包含有目標,標記為0;舍棄0.3<IoU<0.7時的初始候選框;當真實框Gr沒有與之對應的初始候選框的IoU>0.7時,將與真實框Gr的IoU最大的框也標記為1;
(3c2)區域生成子網絡中的卷積層-ReLU層對每個篩選后的候選框A1i進行特征提取,得到特征圖集合f'={f1',f2',...,fq',...,fm'};
(3c3)第一分類子網絡根據特征圖集合f'={f1',f2',...,fq',...,fm'}計算每個候選框A1i含有目標的概率pi;第一定位模塊根據特征圖集合f'={f1',f2',...,fq',...,fm'}計算候選框A1i的預測偏移量d1i和預測候選框坐標[A’1ix,A’1iy,A’1iw,A’1ih];
(3c4)proposal層采用非極大值抑制方法,選取所有候選框中含有目標的概率得分pi排名前K個候選框,其中每個候選框坐標為[A2kx,A2ky,A2kw,A2kh],k∈K;
(3d)ROI Align池化層將前K個候選框的每個候選框的坐標值A2kx,A2ky,A2kw,A2kh分別縮小16倍,映射到特征圖fq的對應位置得到K個感興趣區域;將每個感興趣區域劃分為相同大小的7×7的子圖;對每個子圖進行最大池化操作,得到統一尺度的K個感興趣區域;
(3e)分類定位子網絡的全連接層將統一尺度的K個感興趣區域提取特征,得到特征圖集合f”={f1”,f2”,...,fq”,...,fK”};第二分類子網絡通過f”={f1”,f2”,...,fq”,...,fK”}計算每個候選框內目標的預測類別pc,同時第二定位模塊通過f”={f1”,f2”,...,fq”,...,fK”}計算候選框的精確坐標[Akx,Aky,Akw,Akh];
(3f)采用第一分類子網絡的改進的交叉熵損失函數FLcls1(pi),通過pi計算自己的損失值FLcls1,采用第一定位模塊的損失函數Lreg1(d’1i,d1i),通過d’1i和d1i計算自己的損失值Lreg1,采用第二分類子網絡的改進的交叉熵損失函數FLcls2(pc),通過pc計算自己的損失值FLcls2,采用第二定位模塊的損失函數Lreg2(d'2k,d2k),通過d'2k和d2k計算自己的損失值Lreg2,再采用反向傳播方法,通過FLcls1、Lreg1、FLcls2和Lreg2計算遙感圖像目標檢測模型參數梯度,然后采用梯度下降算法,通過遙感圖像目標檢測模型參數梯度對網絡參數θ進行更新;
(3g)判斷t=T是否成立,若是,得到訓練好的基于改進的交叉熵損失函數的遙感圖像目標檢測模型,否則,令t=t+1,并執行步驟(3b);
(4)獲取遙感圖像目標的檢測結果:
將測試樣本集作為訓練好的基于改進的交叉熵損失函數的遙感圖像目標檢測模型的輸入進行檢測,得到每個目標的類別和邊界框四個頂點坐標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011462894.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于皮帶機的外轉子電機
- 下一篇:一種PCB測試治具





