[發明專利]一種遙感圖像多類目標檢測和識別方法有效
| 申請號: | 201210300645.8 | 申請日: | 2012-08-22 |
| 公開(公告)號: | CN102867195A | 公開(公告)日: | 2013-01-09 |
| 發明(設計)人: | 韓軍偉;周培誠;王東陽;郭雷;程塨;李暉暉 | 申請(專利權)人: | 西北工業大學 |
| 主分類號: | G06K9/66 | 分類號: | G06K9/66 |
| 代理公司: | 西北工業大學專利中心 61204 | 代理人: | 王鮮凱 |
| 地址: | 710072 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 遙感 圖像 類目 檢測 識別 方法 | ||
1.一種遙感圖像多類目標檢測和識別方法,其設計步驟如下:
步驟1:使用基于稀疏表示字典學習的方法訓練字典,具體步驟如下:
步驟a1訓練圖像前期處理:首先將原始圖像中的同類別目標統一到一個主方向,然后將統一方向后的圖像沿著0°到360°、按照步長旋轉為個不同方向的圖像;將不同類別目標的原始圖像都按照上述方法處理,得到類訓練圖像,其中p為所要檢測的不同類別目標數,為旋轉角度,c是所得到的訓練圖像中不同目標不同方向圖像的類別總個數;其中:為向下取整;
步驟b1數據預處理:采用加權平均法對類訓練圖像的RGB三個分量進行加權平均得到灰度圖像,然后對灰度圖像進行下采樣處理,得到n×n大小的圖像;對n×n大小的圖像進行能量歸一化處理得到歸一化圖像,再將歸一化圖像轉換為n2×1維的列向量,將列向量作為訓練數據中的一列,得到預處理后的訓練數據集U=[U1,U2,…,Uc],其中U1是訓練數據集U中對應第i類的子數據集,i=1,2,…,c;
步驟c1訓練字典:通過Fisher?Discrimination?Dictionary?Learning?for?Sparse?Representation發布的FDDL軟件包訓練已知訓練數據集U=[U1,U2,..,Uc],得到字典D=[D1,D2,…,Dc],其中,Di是與第i類相對應的子字典;
步驟2稀疏編碼:根據訓練所得到的字典D=[D1,D2,…,Dc],對測試圖像中的每個子圖像塊進行稀疏編碼,求出每個子圖像塊對應的稀疏系數,具體處理步驟如下:
步驟a2測試圖像預處理:首先使用步驟b1中所述的加權平均法將測試圖像轉化為測試灰度圖像,然后使用大小為S×S的滑動窗口沿著測試灰度圖像以間隔步長b滑動得到子圖像塊;將子圖像塊下采樣處理到大小為n×n的圖像,然后進行能量歸一化處理,再將能量歸一化處理后的圖像轉換為一個n2×1維的列向量β,用列向量β來表示通過滑動窗口所得到的子圖像塊的像素灰度值信息;
步驟b2稀疏編碼:對每個子圖像塊通過優化模型
得到對應每個子圖像塊的稀疏編碼系數其中是與子字典Di所對應的系數向量,ε>0是容許誤差,||·||1為l1范數,||·||2為l2范數;
步驟c2求取重構誤差:根據稀疏編碼系數計算每個子圖像塊與每一類的重構誤差ei,取e=min{ei}作為此子圖像塊的重構誤差,并記錄其所對應的類別然后根據重構誤差e與預先設定的閾值τ之間的大小關系來判定此子圖像塊中是否包含目標:如果e<τ,說明包含目標,否則,說明此子圖像塊為背景;
步驟3目標檢測與識別:
步驟a3:將步驟c2中判定包含目標的每個子圖像塊所對應的重構誤差e,組成一個與測試灰度圖像大小一致的、表示候選目標區域的重構誤差矩陣E=(est)P×Q;其中,est為重構誤差矩陣在坐標點(s,t)處的值,
將步驟c2中判定包含目標的每個子圖像塊所對應的類別C,組成一個與測試灰度圖像大小一致的、表示候選目標類別的類別矩陣L=(Cst)P×Q;其中Cst為類別矩陣在坐標點(s,t)處的值,
步驟b3:改變滑窗S×S的大小G次,重復步驟2~步驟a3G次,得到的G個重構誤差矩陣和G個類別矩陣,G的取值范圍為5~10;將得到的G個重構誤差矩陣組成一個多尺度重構誤差矩陣MAP=(estg)P×Q×G;其中,estg為矩陣MAP中的元素,其值為第g次改變滑窗大小得到的重構誤差矩陣所對應的est,P×Q×G為多尺度重構誤差矩陣的大小,g=1,2,…G;
將得到的G個類別矩陣構成一個多尺度類別矩陣CLASS=(Cstg)P×Q×G;其中,Cstg為矩陣CLASS中的元素,其值為第g次改變滑窗大小得到的類別矩陣所對應的Cst;根據多尺度重構誤差矩陣MAP得到一個最小重構誤差矩陣(map(s,t))P×Q,其中map(s,t)為對應最小重構誤差矩陣在坐標點(s,t)處的值,
然后求出對應最小重構誤差矩陣的最小類別矩陣(class(s,t))P×Q,其中class(s,t)為最小類別矩陣在坐標點(s,t)處的值,
根據多尺度重構誤差矩陣MAP求出尺度矩陣scale=(scale(s,t))P×Q,scale(s,t)為對應尺度矩陣在坐標點(r,t)處的值,
步驟c3:求取最小重構誤差矩陣(map(s,t))P×Q的局部鄰域極小值作為檢測到的目標響應值,局部鄰域極小值在最小重構誤差矩陣(map(s,t))P×Q中所對應的坐標即為目標的中心位置,根據中心位置在(class(s,t))P×Q和(scale(s,t))P×Q中對應的位置找到目標所對應的類別及尺度大小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北工業大學,未經西北工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210300645.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電機軸花鍵端旋變調零工裝
- 下一篇:專用滑環拔出器
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





