[發(fā)明專利]一種基于金字塔通道特征注意力的神經(jīng)網(wǎng)絡(luò)圖像去霧方法有效
| 申請?zhí)枺?/td> | 202010320431.1 | 申請日: | 2020-04-21 |
| 公開(公告)號: | CN111539888B | 公開(公告)日: | 2023-08-04 |
| 發(fā)明(設(shè)計)人: | 張笑欽;王濤;王金鑫;趙麗 | 申請(專利權(quán))人: | 溫州大學(xué) |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06N3/0464;G06N3/048;G06N3/08 |
| 代理公司: | 北京中北知識產(chǎn)權(quán)代理有限公司 11253 | 代理人: | 陳孝政 |
| 地址: | 325000 浙江省溫州市甌海經(jīng)濟(jì)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 金字塔 通道 特征 注意力 神經(jīng)網(wǎng)絡(luò) 圖像 方法 | ||
1.一種基于金字塔通道特征注意力的神經(jīng)網(wǎng)絡(luò)圖像去霧方法,其特征在于:包括以下步驟:
S1、構(gòu)建圖像去霧模型;其中,該圖像去霧模型包括三尺度特征提取器、金字塔通道特征注意力模塊和圖像重構(gòu)模塊;
S2、獲取有霧圖像數(shù)據(jù),利用三尺度特征提取器提取霧圖三種不同尺度的特征圖,其中不同尺度的特征圖表示霧圖受到霧影響不同的特征;
S3、利用圖像去霧模型中的金字塔通道特征注意力模塊將特征圖進(jìn)行動態(tài)融合,并利用注意力機制進(jìn)行去霧處理;
所述金字塔通道注意力模塊從上到下,將由步驟S2輸出的低層、中層和高層特征按高層,中層和低層的順序交替融合,融合的過程首先分別對高層、中層和低層特征分別利用通道注意力機制分別增強,接著利用拼接操作先將增強后的高層特征和中層進(jìn)行高效的融合,然后將融合后的特征和增強后的低層再次用拼接操作進(jìn)行融合,特征在融合的過程中也不斷在進(jìn)行去霧處理;
所述金字塔通道注意力機制模塊主要有4個通道注意力機制模塊、2個3×3的卷積和特征拼接操作構(gòu)成,其中通道注意力機制模塊的功能為:
a).全局平均池化操作把二維特征圖轉(zhuǎn)化為實數(shù);
b).使用兩個卷積操作進(jìn)行通道權(quán)重的學(xué)習(xí);
c).使用門控非線性sigmoid激活函數(shù);
d).使用尺度操作,將每個權(quán)重加到特征圖上;
S4、將去霧處理后的特征通過圖像重構(gòu)模塊重構(gòu)為清晰的無霧圖像;
S5、計算恢復(fù)圖像和對應(yīng)清晰圖像的均方誤差和邊緣損失,更新圖像去霧模型;其中均方誤差指導(dǎo)圖像去霧模型學(xué)習(xí)清晰圖像的內(nèi)容,邊緣損失指導(dǎo)圖像去霧模型關(guān)注圖像細(xì)節(jié)結(jié)構(gòu),兩種損失函數(shù)協(xié)作指導(dǎo)去霧模型去霧性能。
2.根據(jù)權(quán)利要求1所述的一種基于金字塔通道特征注意力的神經(jīng)網(wǎng)絡(luò)圖像去霧方法,其特征在于:步驟S5,具體包括:
對恢復(fù)的圖像和對應(yīng)的清晰圖像計算均方誤差和邊緣損失,這兩種損失具體為:
其中,C,H,W分別表示圖像的通道數(shù),高和寬;Iclear表示清晰的圖像;Idehazed表示圖像去霧模型恢復(fù)的圖像;
Ledge=||tan(Conv(Iclear,klaplace))-tan(Conv(Idehazed,klaplace))||1,
其中,Iclear表示清晰的圖像;Idehazed表示圖像去霧模型恢復(fù)的圖像;tanh表示非線性激活函數(shù)tanh;klaplace表示拉普拉斯算子;||||1表示L1范數(shù);
總的去霧模型損失函數(shù)為:
Ltotal=Lmse+ɑ*Ledge,
其中,ɑ為超參數(shù),用來平衡均方誤差損失和邊緣損失;均方誤差損失指導(dǎo)圖像去霧模型學(xué)習(xí)清晰圖像的內(nèi)容,邊緣損失指導(dǎo)圖像去霧模型側(cè)重學(xué)習(xí)清晰圖像的細(xì)節(jié)結(jié)構(gòu),兩種損失協(xié)同指導(dǎo)圖像去霧模型達(dá)到優(yōu)越的去霧性能。
3.根據(jù)權(quán)利要求1所述的一種基于金字塔通道特征注意力的神經(jīng)網(wǎng)絡(luò)圖像去霧方法,其特征在于:步驟S2具體包括:
獲取有霧圖片,使用三尺度特征提取器提取三種不同尺度的特征,該特征提取器與其他方法的特征提取器最大的不同是無需提前訓(xùn)練且是輕量級的特征提取器;該提取器自下而上由三個部分組成,每個部分都是由一個3×3的卷積和連個連續(xù)的殘差塊,每經(jīng)過一個部分特征圖的大小減半,特征圖的深度從32升到64再升到128;每個部分最后一層的特征圖作為輸出,三種特征分別代表了輸入霧圖低層、中層和高層的特征,這些特征表示圖像語義越來越強。
4.根據(jù)權(quán)利要求1所述的一種基于金字塔通道特征注意力的神經(jīng)網(wǎng)絡(luò)圖像去霧方法,其特征在于:步驟S4具體包括:
所述圖像重構(gòu)模塊包括一個3×3的卷積層構(gòu)成,將去霧處理后的高維特征圖重構(gòu)為清晰的無霧圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于溫州大學(xué),未經(jīng)溫州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010320431.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





