[發明專利]一種基于深度學習的單幅圖像去霧算法有效
| 申請號: | 201710113254.8 | 申請日: | 2017-02-28 |
| 公開(公告)號: | CN106910175B | 公開(公告)日: | 2020-01-24 |
| 發明(設計)人: | 肖進勝;鄒文濤;雷俊鋒;章勇勤;高威;岳學東 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00 |
| 代理公司: | 42222 武漢科皓知識產權代理事務所(特殊普通合伙) | 代理人: | 魯力 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 單幅 圖像 算法 | ||
1.一種基于深度學習的單幅圖像去霧算法,其特征在于,具體包括如下步驟:
步驟1、獲取Middlebury Stereo Datasets以及在網上下載明亮的且無霧的圖像作為訓練樣本中的無霧圖像集;
步驟2、對無霧圖像集利用Adobe lightroom CC方法人工加霧,并對無霧圖像集添加了不同濃度的霧,得到有霧圖像集;將有霧圖像集和無霧圖像集轉換成HDF5的數據格式,生成訓練樣本和測試樣本,便于訓練,具體包括:
步驟2.1、基于lightroom CC方法的dehaze功能人工的為步驟1中的無霧圖像集加霧,為了能夠適應不同天氣條件下的霧濃度,學習到不同霧濃度圖像的特征,對無霧圖像集合成了濃度分別為10,20,30,40,50,60,70,80,90,100的霧,得到有霧圖像集;
步驟2.2、挑選有霧圖像和無霧圖像1450對作為訓練樣本,剩余302對作為測試樣本;
步驟2.3、將訓練樣本和測試樣本分別裁剪成29*29和25*25的圖像塊,
步驟2.4、再將訓練樣本和測試樣本的圖像塊轉換為HDF5格式作為網絡輸入;
步驟3、將HDF5格式的訓練樣本和測試樣本輸入至卷積神經網絡,具體包括:
步驟3.1、進行特征提取:由一層卷積網絡構成,包含56個5*5的高斯濾波器;輸入的每一個有霧圖像塊與所有濾波器進行卷積,每一個輸入圖像塊被一個高維特征向量所代表;
步驟3.2、進行維度收縮:由一層卷積網絡構成,包含12個1*1的高斯濾波器;維度收縮層用來降低特征向量維度;
步驟3.3、進行非線性映射:由六層卷積網絡構成,每一層都包含12個3*3的高斯濾波器;該部分濾波器的個數和網絡的層數都是影響最后效果的重要因素;
步驟3.4、進行維度擴展:由一層網絡構成,包含56個1*1的高斯濾波器;該部分可以看做是第二部分的逆過程,這一部分將低維度特征向量擴展到高維度,保存細節特征;
步驟3.5、進行反卷積:由一層網絡構成,包含3個5*5的高斯濾波器;該部分主要利用一組反卷積高斯濾波器來聚合先前的特征向量,恢復出無霧圖像;
步驟3.6、每一個卷積網絡層后面都會跟著一個激活函數層,這里我們選用參數修正線性單元PReLU(Parametric Rectified Linear Uint);
激活函數可以被定義為f(xi)=max(xi,0)+ai·min(0,xi);
步驟4、設置好網絡的學習率和動量參數,利用caffe訓練上述卷積神經網絡,直至代價損失減小到一定程度且訓練達到迭代最大次數,生成訓練模型;
步驟5、將有霧圖像輸入至訓練好的模型中,輸出無霧圖像。
2.根據權利要求1所述的一種基于深度學習的單幅圖像去霧算法,其特征在于,步驟4所述的訓練過程為:
步驟4.1、網絡結構確定以后,將訓練樣本和測試樣本輸入網絡;
步驟4.2、因為輸入有霧圖像和輸出無霧圖像都是彩色的,三個通道同時做比較,loss比單個通道比較要大三倍,所以將學習率設置的相對較小0.00005,防止不收斂,設置每十萬次迭代,學習率變為原來的0.8倍;動量參數設置為0.9;最大迭代次數設置為100萬次;
步驟4.3、進行訓練,得到無霧圖像和有霧圖像之間的映射關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710113254.8/1.html,轉載請聲明來源鉆瓜專利網。





