[發(fā)明專利]基于特征學習的單幅圖像去霧方法有效
| 申請?zhí)枺?/td> | 201610025389.4 | 申請日: | 2016-01-13 |
| 公開(公告)號: | CN105719247B | 公開(公告)日: | 2019-05-17 |
| 發(fā)明(設(shè)計)人: | 王美華;梁云;麥嘉銘 | 申請(專利權(quán))人: | 華南農(nóng)業(yè)大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510642 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 學習 單幅 圖像 方法 | ||
1.一種基于特征學習的單幅圖像去霧方法,其特征在于,包括以下步驟:
S1.獲取一組有霧圖像Iset及其對應(yīng)的場景深度圖dset作為訓練數(shù)據(jù)集;
S2.利用數(shù)據(jù)集Iset和dset訓練稀疏自動編碼機,該稀疏自動編碼機用于提取與霧相關(guān)的紋理結(jié)構(gòu)特征;
S3.利用訓練好的稀疏自動編碼機,對Iset中的每一幅有霧圖像Ii提取與霧有關(guān)的紋理結(jié)構(gòu)特征Ti;
S4.對Iset中的每一幅有霧圖像Ii提取與霧有關(guān)的顏色特征Di、Ci、Ri、Gi和Bi,分別表示暗原色特征、顏色衰減特征、圖像的R通道、圖像的G通道和圖像的B通道;
S5.以Iset中每一幅有霧圖像所提取的特征Ti、Di、Ci、Ri、Gi和Bi作為輸入的訓練數(shù)據(jù),同時以dset中對應(yīng)的場景深度圖di作為訓練標簽,訓練多層神經(jīng)網(wǎng)絡(luò);該網(wǎng)絡(luò)用于表示不同特征組合與場景深度之間的映射關(guān)系,以有霧圖像的紋理結(jié)構(gòu)特征及不同的顏色特征作為輸入,輸出其對應(yīng)的場景深度;
S6.輸入一幅待復原的有霧圖像I,利用訓練好的稀疏自動編碼機提取有霧圖像I的與霧相關(guān)的紋理結(jié)構(gòu)特征T;
S7.提取有霧圖像I的與霧相關(guān)的顏色特征D、C、R、G和B;
S8.利用訓練好的多層神經(jīng)網(wǎng)絡(luò),以T、D、C、R、G和B作為輸入,輸出有霧圖像I所對應(yīng)的場景深度圖d;
S9.根據(jù)大氣散射模型,利用d估算出大氣光照度A;
S10.結(jié)合有霧圖像I、場景深度圖d和大氣光照度A,復原出對應(yīng)的無霧圖像J;對于給定一組有霧圖像Iset及其對應(yīng)的場景深度圖dset,所述步驟S2中的稀疏自動編碼機是經(jīng)過樣本訓練得到的,具體的訓練方式為:
自動編碼機由兩部分組成:第一部分為稀疏編碼,用于提取局部塊的主要紋理與結(jié)構(gòu)特征,通過一個無監(jiān)督自學習的3層神經(jīng)網(wǎng)絡(luò)實現(xiàn),網(wǎng)絡(luò)的輸入是向量化的局部塊,隱含層的輸出S是對輸入的向量進行降維后所得到的特征,網(wǎng)絡(luò)的輸出為S再次映射到高維時所得到的輸出向量;第二部分為一個2層神經(jīng)網(wǎng)絡(luò),用于獲得紋理結(jié)構(gòu)特征與場景深度之間的映射關(guān)系;
稀疏自動編碼機中的網(wǎng)絡(luò)使用sigmoid函數(shù)f(x)=1/(1+e-x)作為傳輸函數(shù),其訓練時,首先從訓練樣本集Iset中,隨機選取N個大小均為r×r的局部塊作為第一部分的網(wǎng)絡(luò)輸入,進行無監(jiān)督學習;然后,以第一部分隱含層輸出作為第二部分的網(wǎng)絡(luò)輸入;最后,對每一個r×r的局部塊,在訓練樣本集dset中找到相對應(yīng)的局部塊,以其中心位置的場景深度作為標簽,進行有監(jiān)督學習;對于一幅有霧圖像I,提取與霧有關(guān)的顏色特征的提取方法,具體實現(xiàn)如下:
給定一幅有霧圖像I及其對應(yīng)的大氣光照度A,提取3類顏色特征,分別是:暗原色特征、顏色衰減特征以及圖像的RGB空間下的3個通道分量;
暗原色特征定義如下:
其中,Ω(x)是以x為中心,大小為15×15的局部塊,Ic表示有霧圖像I在顏色通道c下的分量,D表示局部塊尺寸為15×15的暗原色特征;
顏色衰減特征定義如下:
其中,Ival和Isat分別為有霧圖像在HSV顏色空間下的亮度分量和飽和度分量,θ0、θ1和θ2為線性系數(shù);
有霧圖像I中RGB空間下的三個分量也作為本方法的顏色特征,三個分量分別為R通道分量、G通道分量和B通道分量,定義如下:
R=Ired
G=Igreen
B=Iblue
上式中,Ired、Igreen和Iblue分別表示有霧圖像I在RGB顏色空間上的三個分量;所述步驟S5中多層神經(jīng)網(wǎng)絡(luò)的訓練方法,依賴于一組用于訓練的有霧圖像Iset及其對應(yīng)的場景深度圖dset;具體的訓練方法如下:
多層神經(jīng)網(wǎng)絡(luò)包含3層,分別為輸入層、隱含層和輸出層,輸入層中神經(jīng)元的個數(shù)與特征圖的數(shù)目相等,隱含層中的神經(jīng)元個數(shù)是輸入層的2倍,輸出層只有一個神經(jīng)元,表示最終輸出的場景深度;其過程為:
首先分別對訓練樣本集Iset中的有霧圖像I1,I2,…,In進行特征提取,每一幅有霧圖像Ii對應(yīng)6幅特征圖R、G、B、C、D和T,然后,以這些特征作為輸入,以訓練樣本集dset中的真實場景深度di作為標簽,采用反向傳播算法對網(wǎng)絡(luò)進行有監(jiān)督學習,最后得到訓練后的神經(jīng)網(wǎng)絡(luò)模型;
所述步驟S9中的大氣光照度A的估計方法,依賴于一幅有霧圖像I及其對應(yīng)的場景深度圖d;具體的估計方法如下:
給定一幅有霧圖像I及對應(yīng)的場景深度圖d,其大氣光照度A可進一步通過下式估算得出:
其中,x和y用于表示圖像中的坐標;
所述步驟S10中利用有霧圖像I、大氣光照度A和場景深度圖d復原出無霧圖像的方法;具體的圖像復原方法如下:
已知有霧圖像I、大氣光照度A和場景深度圖d,根據(jù)大氣散射模型,可由下式復原出無霧圖像:
其中,β是大氣散射系數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南農(nóng)業(yè)大學,未經(jīng)華南農(nóng)業(yè)大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610025389.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





