[發(fā)明專利]基于元學(xué)習(xí)和跨階段沙漏的大視場小樣本目標檢測方法有效
| 申請?zhí)枺?/td> | 202110487663.0 | 申請日: | 2021-05-06 |
| 公開(公告)號: | CN113221993B | 公開(公告)日: | 2023-08-01 |
| 發(fā)明(設(shè)計)人: | 李文濤;李良偉;黑永強;李世玉;郇金曉 | 申請(專利權(quán))人: | 西安電子科技大學(xué) |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
| 代理公司: | 陜西電子工業(yè)專利中心 61205 | 代理人: | 陳宏社;王品華 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 學(xué)習(xí) 階段 沙漏 視場 樣本 目標 檢測 方法 | ||
1.一種基于元學(xué)習(xí)和跨階段沙漏的大視場小樣本目標檢測方法,其特征在于,包括如下步驟:
(1)構(gòu)建第一訓(xùn)練樣本集、第二訓(xùn)練樣本集和測試樣本集:
(1a)從大視場圖像數(shù)據(jù)庫中選取包括C個目標類別的M幅尺寸為H×W的圖像T={Tm|1≤m≤M},并對每幅圖像Tm中的目標進行標注,得到T對應(yīng)的標簽集合G={Gm|1≤m≤M},其中,C≥4,M≥200,Tm表示第m幅圖像,Gm表示Tm對應(yīng)的標簽;
(1b)按照先行后列的順序,并以大小為SH×SW的滑窗將每幅圖像Tm裁剪成N個圖像塊,得到圖像塊集合T′={T′m|1≤m≤M}和標簽塊集合G′={G′m|1≤m≤M},其中T′m表示Tm對應(yīng)的圖像塊子集合,T′m={T′mn|1≤m≤M,1≤n≤N},T′mn表示T′m中的第n個圖像塊,G′m表示T′m對應(yīng)的標簽塊子集,G′m={G′mn|1≤m≤M,1≤n≤N},G′mn表示T′mn對應(yīng)的標簽,
(1c)篩選出標簽塊集合G′中交并比大于閾值的標簽G′mn,得到篩選標簽塊集合G″={G″m|1≤m≤M};
(1d)將圖像塊集合T′中的C1個目標類別的M1幅圖像及其對應(yīng)的篩選標簽作為第一訓(xùn)練樣本集,并剩余的C2個目標類別的M2幅圖像及其對應(yīng)的篩選標簽中的一半作為第二訓(xùn)練樣本集,另一半作為測試樣本集,其中,M1≥5×M2,M1+M2=M,C1+C2=C;
(2)構(gòu)建基于跨階段沙漏結(jié)構(gòu)的一階段目標檢測模型H1:
構(gòu)建包括級聯(lián)的特征提取器fextractor、特征解碼器fdecoder和第一類別生成器fclass1的一階段目標檢測模型H1,其中,fextractor包括交叉層疊的多個下采樣層和多個跨階段沙漏層;fdecoder包括順次連接的多個上采樣層;fclass1包括3個并行分布的卷積層,第一卷積層的激活函數(shù)為Sigmoid,輸出通道數(shù)與圖像塊集合T′中的目標類別個數(shù)C1相同,第二卷積層和第三卷積層的激活函數(shù)均為ReLU,輸出通道數(shù)均為2;
(3)對基于跨階段沙漏結(jié)構(gòu)的一階段目標檢測模型H1進行迭代預(yù)訓(xùn)練:
(3a)初始化迭代次數(shù)為e,最大迭代次數(shù)為E,E≥120,學(xué)習(xí)率為l=1.25×10-4,并令e=1;
(3b)從第一訓(xùn)練樣本集有回放的隨機選取的B個訓(xùn)練樣本,并對每個訓(xùn)練樣本的標簽分別進行熱力圖轉(zhuǎn)化、寬高矩陣轉(zhuǎn)化和偏移矩陣轉(zhuǎn)化,得到帶有熱力圖標簽、寬高矩陣標簽和偏移矩陣標簽的B個標簽轉(zhuǎn)化后的訓(xùn)練樣本,8≤B≤32;
(3c)將B個標簽轉(zhuǎn)化后的訓(xùn)練樣本作為一階段目標檢測模型H1的輸入,特征提取器fextractor對每個訓(xùn)練樣本的圖像進行特征提取,特征解碼器fdecoder對所提取每個特征進行解碼,類別生成器fclass1中的第一卷積層對每個解碼結(jié)果進行熱力圖變換,第二卷積層對每個解碼結(jié)果進行寬高矩陣變換,第三卷積層對每個解碼結(jié)果進行偏移矩陣變換,得到B個預(yù)測熱力圖、B個預(yù)測寬高矩陣和B個預(yù)測偏移矩陣;
(3d)采用Focal?Loss損失函數(shù),并通過B個熱力圖標簽和B個預(yù)測熱力圖計算B個訓(xùn)練樣本的熱力圖損失值Lheatmap,同時采用L1損失函數(shù),并通過B個寬高矩陣標簽和B個預(yù)測寬高矩陣,以及B個偏移矩陣標簽和B個預(yù)測偏移矩陣,計算B個訓(xùn)練樣本的寬高損失值Lsize以及偏移損失值Loff,然后對Lheatmap、Lsize和Loff進行加權(quán)求和,得到訓(xùn)練樣本的損失值L;
(3e)采用反向傳播方法,并通過損失值L計算一階段目標檢測模型H1的權(quán)重參數(shù)梯度F,再采用Adam優(yōu)化算法,并通過F和學(xué)習(xí)率l對一階段目標檢測模型H1的權(quán)重參數(shù)進行更新;
(3f)判斷e>E是否成立,若是,得到訓(xùn)練好的一階段目標檢測模型H′1,否則,令e=e+1,并執(zhí)行步驟(3b);
(4)構(gòu)建基于跨階段沙漏結(jié)構(gòu)的二階段目標檢測模型H2:
構(gòu)建包括訓(xùn)練好的一階段目標檢測模型H′1中的特征提取器f′extractor和特征解碼器f′decoder,以及第二類別生成器fclass2的基于跨階段沙漏結(jié)構(gòu)的二階段目標檢測模型H2,f′extractor、f′decoder和fclass2依次級聯(lián);
(5)基于元學(xué)習(xí)的方法對基于跨階段沙漏結(jié)構(gòu)的二階段目標檢測模型H2進行迭代訓(xùn)練:
(5a)初始化迭代次數(shù)為a,最大迭代次數(shù)為A,A≥2000,元學(xué)習(xí)率為r1=1.25×10-4,并令a=1;
(5b)初始化元學(xué)習(xí)的子任務(wù)迭代次數(shù)為v,元學(xué)習(xí)的最大迭代子任務(wù)數(shù)V,總?cè)蝿?wù)損失為LV,并令v=1,LV=0,其中,2≤V≤10;
(5c)從第二訓(xùn)練樣本集中隨機選取包括c個目標類別的k個訓(xùn)練樣本,并對每個訓(xùn)練樣本的標簽分別進行熱力圖轉(zhuǎn)化、寬高矩陣轉(zhuǎn)化和偏移矩陣轉(zhuǎn)化,得到每個訓(xùn)練樣本帶有熱力圖標簽、寬高矩陣標簽和偏移矩陣標簽的標簽轉(zhuǎn)化后的c×k訓(xùn)練樣本,然后從c×k訓(xùn)練樣本隨機選取c×kspt個作為支持集,選取c×kqry個訓(xùn)練樣本作為查詢集,其中,1≤c≤C2,k≥15,1≤kspt≤5,5≤kqry≤10;
(5d)將支持集作為二階段目標檢測模型H2的輸入,特征提取器f′extractor對每個圖像塊進行特征提取,特征解碼器f′decoder對所提取每個特征進行解碼,類別生成器fclass2中的第一卷積層對每個解碼結(jié)果進行熱力圖變換,第二卷積層對每個解碼結(jié)果進行寬高矩陣變換,第三卷積層對每個解碼結(jié)果進行偏移矩陣變換,得到c×kspt個預(yù)測熱力圖、c×kspt個預(yù)測寬高矩陣和c×kspt個預(yù)測偏移矩陣;
(5e)采用Focal?Loss損失函數(shù),并通過c×kspt個預(yù)測熱力圖及其對應(yīng)的標簽計算支持集的熱力圖損失值L′heatmap,同時采用L1損失函數(shù),并通過c×kspt個預(yù)測寬高矩陣及其對應(yīng)的標簽,以及c×kspt個預(yù)測偏移矩陣及其對應(yīng)的標簽,計算支持集的寬高損失值L′size以及偏移損失值L′off,然后對L′heatmap、L′size和L′off進行加權(quán)求和,得到支持集的損失值L′;
(5f)采用反向傳播方法,并通過支持集的損失值L′計算二階段目標檢測模型H2的權(quán)重參數(shù)梯度F′,再采用Adam優(yōu)化算法,并通過F′和學(xué)習(xí)率r2=3×10-4對二階段目標檢測模型H2權(quán)重參數(shù)進行更新,得到權(quán)重參數(shù)更新后的二階段目標檢測模型
(5g)將查詢集作為權(quán)重參數(shù)更新后的二階段目標檢測模型的輸入,中的特征提取器對每個圖像塊進行特征提取,特征解碼器對所提取每個特征進行解碼,類別生成器中的第一卷積層對每個解碼結(jié)果進行熱力圖變換,第二卷積層對每個解碼結(jié)果進行寬高矩陣變換,第三卷積層對每個解碼結(jié)果進行偏移矩陣變換,得到c×kqry個預(yù)測熱力圖、c×kqry個預(yù)測寬高矩陣和c×kqry個預(yù)測偏移矩陣;
(5h)采用Focal?Loss損失函數(shù),并通過c×kqry個預(yù)測熱力圖及其對應(yīng)的標簽計算查詢集的熱力圖損失值L″heatmap,同時采用L1損失函數(shù),并通過c×kqry個預(yù)測寬高矩陣及其對應(yīng)的標簽,以及c×kqry個預(yù)測偏移矩陣及其對應(yīng)的標簽,計算查詢集的寬高損失值L″size以及偏移損失值L″off,然后對L″heatmap、L″size和L″off進行加權(quán)求和,得到查詢集的損失值L″;
(5i)令令LV=LV+L″,并判斷v>V是否成立,若是,執(zhí)行步驟(5j),否則,令v=v+1,并執(zhí)行步驟(5c);
(5j)采用反向傳播方法,并通過平均任務(wù)損失L′V=LV/V計算二階段目標檢測模型H2的權(quán)重參數(shù)梯度F″,再采用Adam優(yōu)化算法,并通過F″和元學(xué)習(xí)率r1對二階段模型參數(shù)H2進行更新;
(5k)判斷a>A是否成立,若是,得到訓(xùn)練好的二階段目標檢測模型H′2,否則,令a=a+1,并執(zhí)行步驟(5b);
(6)獲取目標檢測結(jié)果:
(6a)將測試樣本集作為訓(xùn)練好的二階段目標檢測模型H′2的輸入進行前向傳播,得到個預(yù)測熱力圖、預(yù)測寬高矩陣以及預(yù)測偏移矩陣;
(6b)通過所提取的每個測試樣本的預(yù)測熱力圖、預(yù)測寬高矩陣以及預(yù)測偏移矩陣的目標檢測信息,計算每個目標檢測框的位置,得到個目標檢測結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安電子科技大學(xué),未經(jīng)西安電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487663.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進式學(xué)習(xí)管理方法及漸進式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)





