[發明專利]一種基于深度學習的航拍圖像水體提取方法與系統在審
| 申請號: | 202011064488.6 | 申請日: | 2020-09-30 |
| 公開(公告)號: | CN112203072A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 賴慧芳;曾強 | 申請(專利權)人: | 賴慧芳 |
| 主分類號: | H04N9/64 | 分類號: | H04N9/64;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 523077 廣東省東莞市南城*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 航拍 圖像 水體 提取 方法 系統 | ||
1.一種基于深度學習的航拍圖像水體提取方法,其特征在于,該方法包括:
步驟S1:無人機采集多光譜圖像,通過真彩色合成得到RGB圖像,將RGB圖像轉換為HSV空間,得到H通道的色調圖;由RGB圖像轉換得到灰度圖像;
步驟S2:計算多光譜圖像的水體特征指數,得到水體特征圖F1;根據灰度共生矩陣得到灰度圖像的能量紋理特征圖、熵紋理特征圖,結合色調圖、能量紋理特征圖、熵紋理特征圖得到水體細粒度特征圖F2;計算RGB圖像的顏色矩;
步驟S3:將RGB圖像、顏色矩、F1、F2輸入水體提取模塊,所述水體提取模塊包括語義提取編碼器、語義提取解碼器、FC全連接;
將RGB圖像與F1、F2特征聯合形成多通道圖像ImageA,輸入語義提取編碼器;
語義提取編碼器提取輸入數據的特征,得到特征圖F3;
將RGB圖像的顏色矩輸入FC全連接,輸出多個神經元;
將F3中每個像素的值和對應神經元的值相乘后輸入語義提取解碼器,檢測水體并輸出水體分割圖。
2.如權利要求1所述的方法,其特征在于,所述水體特征指數的計算方法包括:
水體歸一化指數NDWI=(p(Green)-p(NIR))/(p(Green)+p(NIR)),其中p(Green)為綠色波段圖像,p(NIR)為近紅外波段圖像。
3.如權利要求1所述的方法,其特征在于,所述得到水體細粒度特征圖F2的方法包括:
根據公式得到水體細粒度特征圖F2;
x×y為F2中像素數量,F2(x,y)為水體細粒度特征圖中第x行、第y列像素的像素值,H(x,y)為色調圖中第x行、第y列像素的色調值;Image(x,y)為灰度圖像中第x行、第y列像素的灰度值;Entropy(x,y)為熵紋理特征圖圖中第x行、第y列像素的像素值,Energy(x,y)為能量紋理特征圖中第x行、第y列像素的像素值;δ為熵調節系數、ε為能量調節系數。
4.如權利要求1所述的方法,其特征在于,所述水體提取模塊的訓練方法為:
采用若干張ImageA和其對應RGB圖像的顏色矩為數據集;
人工標注出ImageA中每個像素的類別,屬于池塘的像素標注為1,屬于河流的像素標注為2,屬于湖泊的像素標注為3,其他像素標注為0,生成標注數據;
采用Focalloss作為損失函數進行訓練。
5.如權利要求4所述的方法,其特征在于,所述Focalloss為:
L(gt,pr)=-gt×α×(1-pr)γ×log(pr),α為加權因子,γ為聚焦參數,gt為真實值,pr為預測值;
利用超參數搜索對α和γ進行優化,得到最優的α和γ值。
6.一種基于深度學習的航拍圖像水體提取系統,包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至5任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于賴慧芳,未經賴慧芳許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011064488.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多工位定型劃口機及其操作方法
- 下一篇:一種MEC邊界的確定方法及裝置





