[發明專利]基于結合圖像像素先驗和圖像梯度先驗的圖像去模糊方法有效
| 申請號: | 202010543543.3 | 申請日: | 2020-06-15 |
| 公開(公告)號: | CN111681188B | 公開(公告)日: | 2022-06-17 |
| 發明(設計)人: | 祁清 | 申請(專利權)人: | 青海民族大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 劉子文 |
| 地址: | 810007 青*** | 國省代碼: | 青海;63 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 結合 圖像 像素 先驗 梯度 模糊 方法 | ||
1.基于結合圖像像素先驗和圖像梯度先驗的圖像去模糊方法,其特征在于,包括以下步驟:
(1)準備實驗數據,具體包括模糊圖像和標簽圖像;
(2)設置生成器和判別器的網絡結構框架;生成器由DNet和GNet兩個獨立的子網組成,每個子網均采用U型網絡結構,U型網絡結構包括編碼器和解碼器兩部分;將模糊圖像輸入到判別器中,所述編碼器用于下采樣并提取模糊圖像中的細節特征進行編碼,解碼器用于上采樣并得到生成圖像;其中,DNet從圖像像素域的層面對模糊圖像的內容進行恢復,GNet從圖像梯度域的層面對模糊圖像的梯度進行恢復;
判別器采用PatchGAN作為判別器的網絡結構,具體包括一個平卷積層、三個下采樣卷積層、以及一個經過Sigmoid激活函數激活的卷積層;將生成圖像和標簽圖像輸入到判別器中,所述下采樣卷積層用于下采樣并編碼用于表征分類響應的生成圖像和標簽圖像的局部特征;經過Sigmoid激活函數激活的卷積層用于得到最終的分類響應;判別器內每個卷積層后面都添加有Instance Normalization樣本標準化層和Leaky ReLU激活函數,且每個卷積層的卷積核大小為4×4;
(3)設置生成對抗網絡模型的目標損失函數;生成器的目標損失函數由DNet子網和GNet子網兩部分的目標損失函數組成;其中,DNet子網的目標損失函數包括圖像內容目標損失函數Lcontent、圖像像素級重建目標損失函數Lpixel;其中,Lcontent確保生成圖像和標簽圖像能保持相同的語義信息,Lpixel用于減少生成圖像和對應的標簽圖像像素之間的差異;另一方面,GNet子網的目標損失函數由LGradientNet構成,LGradientNet的作用是縮小標簽圖像的梯度強度圖和生成的模糊圖像梯度強度圖之間的差距;判別器中的目標損失函數為Ladv,Ladv用于對生成圖像與標簽圖像的真假進行判別,驅使生成器學習得到的生成圖像接近標簽圖像;
(4)將模糊圖像以及標簽圖像輸入到生成器中進行圖像去模糊學習,與此同時判別器用以判別生成圖像和標簽圖像的真假;判別器將判別的真假概率反饋給生成器,并驅使生成器將生成圖像向著標簽圖像逼近,據此生成器更新網絡的權值參數并進入下一次迭代的訓練;在生成對抗網絡訓練期間,生成器和判別器之間相互競爭學習,直到網絡訓練收斂。
2.根據權利要求1所述基于結合圖像像素先驗和圖像梯度先驗的圖像去模糊方法,其特征在于,步驟(3)中,生成對抗網絡模型的目標損失函數能夠加權地表示為:
L(G,D)=βLcontent+βLpixel+βLGradientNet+αLadv
其中,β和α分別是Lcontent,Lpixel,LGradientNet和Ladv的權重系數;各約束項的權重系數約束如下:β=10,α=1。
3.根據權利要求1所述基于結合圖像像素先驗和圖像梯度先驗的圖像去模糊方法,其特征在于,所述DNet子網將三通道的模糊圖像通過一個平卷積層將模糊圖像維度映射到64×64;然后,利用三個下采樣層用于下采樣并編碼模糊圖像,每一個下采樣層后面分別添加三個稠密塊,模糊圖像的分辨率由256×256遞減至64×64;對應的,解碼器包括三個上采樣層用于上采樣并解碼得到生成圖像,每一個上采樣層前分別添加三個稠密塊,生成圖像分辨率由64×64遞增至256×256;最終,生成圖像由一個Tanh層和一個卷積核為3×3的卷積層重建得到;GNet子網具有和DNet子網相同的網絡結構。
4.根據權利要求1所述基于結合圖像像素先驗和圖像梯度先驗的圖像去模糊方法,其特征在于,所述生成對抗網絡模型搭載在配置為一塊Intel(R)Core(TM)i7 CPU(16GB RAM)3.60GHz的CPU和1塊NVIDIA GeForce GTX 1080Ti GPU的臺式工作站上運行;其中batchsize(批量訓練圖像的個數)是2,G和D學習率是0.0001;激活函數Leaky ReLU的坡度是0.2;網絡使用Adam優化器,其動量參數分別是β1=0.5和β2=0.999。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于青海民族大學,未經青海民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010543543.3/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





