[發明專利]基于紋理描述和深度學習的閾值可學習局部二進制網絡的構建方法以及遙感圖像分類方法有效
| 申請號: | 201910983119.8 | 申請日: | 2019-10-16 |
| 公開(公告)號: | CN110781936B | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 何楚;張清怡;劉新龍;石紫珊 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06N3/08 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 紋理 描述 深度 學習 閾值 局部 二進制 網絡 構建 方法 以及 遙感 圖像 分類 | ||
1.基于紋理描述和深度學習的閾值可學習局部二進制網絡的構建方法,其特征在于,包括:
步驟S1:獲取遙感圖像數據集,將數據集平均分成兩個不重疊的子數據集,分別用于訓練和交叉驗證;
步驟S2:加載在ImageNet數據集上預訓練好的ResNet-50網絡模型,并將ResNet-50網絡模型的最后一層全連接層的輸出維數修改為與圖像類別對應的維數,并在遙感圖像數據集上采用隨機梯度下降和反向傳播算法進行微調,通過反復的迭代學習得到在數據集上收斂的ResNet-50深度模型;
步驟S3:基于深度學習的思想優化手工特征LBP,得到閾值可學習的LBP方法,然后將閾值可學習方法作為LBP層與在ImageNet數據集上預訓練好的ResNet-50網絡模型串聯,得到閾值可學習的局部網絡LBPNet;
步驟S4:將步驟S2中在數據集上收斂的ResNet-50深度模型與步驟S3中閾值可學習的局部網絡LBPNet并聯,構建基于紋理描述和深度學習的閾值可學習局部二進制網絡TLBPNet。
2.如權利要求1所述的方法,其特征在于,步驟S3中閾值可學習的LBP方法具體包括:
步驟S3.1:通過引入LBP閾值核參數以及修改階躍函數對圖像進行閾值化處理;
步驟S3.2:對閾值化的結果進行加權,并對加權后的結果求和作為中心元素閾值可學習的LBP編碼值,提取出LBP編碼圖像;
步驟S3.3:對提取出來的LBP編碼圖像進行像素值的統計,并得到統計直方圖作為結果。
3.如權利要求2所述的方法,其特征在于,引入的LBP閾值核參數為tp(p=0,1,…,7),LBP閾值核是一個3×8的核,對輸入的RGB三通道圖像的每一個通道,各有對應的8個閾值參數需要學習,初始值為均設為1,修改后的階躍函數為步驟S3.1具體包括:根據中心像素的像素值與閾值參數的乘積tpxc以及h(x)函數來閾值化中心像素的鄰域值xp,得到閾值化處理的結果h(xp-tpxc)。
4.如權利要求3所述的方法,其特征在于,步驟S3.2具體包括:
利用2p對閾值化處理的結果h(xp-tpxc)進行加權,其中,p=0,1,…,7。
5.如權利要求4所述的方法,其特征在于,中心元素閾值可學習的LBP編碼值yc的計算方式為:
xc表示中心像素的像素值。
6.如權利要求2所述的方法,其特征在于,步驟S3.3中統計直方圖表達形式為:
其中,
其中,圖片尺寸為I×J,k表示256種編碼值,H(k)表示是特征圖中編碼值k的統計數量,y(i,j)表示是編碼特征圖中(i,j)位置的編碼值,int()函數為取整的函數。
7.如權利要求1所述的方法,其特征在于,步驟S4具體包括:
刪除ResNet-50深度模型的最后一層用于分類的全連接層和閾值可學習的局部網絡LBPNet的最后一層用于分類的全連接層,分別作為兩個特征提取器分別提取遙感圖像數據集的圖像特征;
采用隨機梯度下降和反向傳播算法用全連接層對融合后的特征進行學習直到收斂,從而得到訓練好的基于紋理描述和深度學習的閾值可學習局部二進制網絡TLBPNet。
8.一種遙感圖像分類方法,其特征在于,包括:將待分類的遙感圖像輸入如權利要求1至7任一項權利要求所構建的基于紋理描述和深度學習的閾值可學習局部二進制網絡TLBPNet中,得到圖像分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910983119.8/1.html,轉載請聲明來源鉆瓜專利網。





