[發明專利]基于多尺度卷積組與并行的卷積神經網絡圖像去噪方法有效
| 申請號: | 201910705382.0 | 申請日: | 2019-08-01 |
| 公開(公告)號: | CN110599409B | 公開(公告)日: | 2022-02-22 |
| 發明(設計)人: | 羅靜蕊;王婕 | 申請(專利權)人: | 西安理工大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06N3/04;G06N3/08 |
| 代理公司: | 西安弘理專利事務所 61214 | 代理人: | 杜娟 |
| 地址: | 710048 陜*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 尺度 卷積 并行 神經網絡 圖像 方法 | ||
1.基于多尺度卷積組與并行的卷積神經網絡圖像去噪方法,其特征在于,具體按照以下步驟實施:
步驟1、準備訓練集,選擇合適的數據集作為訓練集中的原始圖像,并對其進行預處理操作,采用高斯白噪聲模擬真實噪聲并加入到原始圖像中,作為與之對應的噪聲圖像;
步驟2、構建網絡模型,結合多尺度卷積組與并行的卷積網絡方式搭建網絡模型;
步驟3、根據步驟2中所構建的網絡模型設置網絡的超參數、損失函數和優化算法;
步驟4、進行網絡訓練,使用步驟2中的構建網絡模型來分別訓練單噪聲訓練集和多噪聲訓練集,來得到多個與訓練集相對應的網絡模型;
步驟5、測試網絡性能;
所述步驟1具體包括以下步驟:
步驟1.1、訓練集包括噪聲圖像和相對應的原始圖像,準備訓練集的方法為:對制作單噪聲訓練集而言,對原始圖像加入固定標準差的高斯白噪聲,其中,噪聲標準差的范圍為σ=[m,n],其中m,n均為正整數,步長為s,s為正整數,可以得到組標準差不同的噪聲圖像,每種噪聲圖像對應相應的原始圖像,形成組單噪聲訓練集;對制作多噪聲訓練集而言,將上述的組標準差不同的噪聲圖像合并成一組,然后與對應的原始圖像合稱為多噪聲訓練集;
步驟1.2、擴大訓練集中的數據,分別對步驟1.1得到的所有單噪聲訓練集進行預處理操作,為了增加訓練集的圖像數量,將每組訓練集進行一定程度的放縮,然后通過合適尺度的滑動窗口進行平移操作,將圖片分割為小塊圖像,這樣做是為了提高網絡的訓練速度,減少輸入的參數數量,之后對小塊圖像進行90°旋轉、180°旋轉、270°旋轉和上下翻轉操作,進一步擴大訓練集中的圖像數量;
所述步驟2具體包括以下步驟:
步驟2.1、網絡首先由兩層不同深度的并行網絡組成,兩個分支采用特征融合加權的方式將淺層的輪廓特征圖與深層的細節特征圖融合,然后進行卷積操作,實現不同特征的加權,最后將兩層分支合并起來,其中,兩層分支的每個卷積層的激活函數都采用線性整流函數,并且給每個卷積層加入歸一化操作;
步驟2.2、將步驟2.1的并行網絡的輸出連接一個多尺度卷積組模塊,多尺度卷積組模塊包括不同大小的卷積核組,對每組卷積操作的結果進行合并操作,最后將合并的結果通過4個串聯的卷積層,其中,上述的每個卷積層的激活函數都采用ReLU函數,并且給每個卷積層加入BN操作,網絡采用殘差學習策略,因此,此時網絡的輸出為學習到的殘差圖像;
步驟2.3、本網絡采用殘差學習策略,因此將網絡輸入的噪聲圖像與步驟2.2中輸出的殘差圖像作相減的操作,得到最終的去噪圖像,至此,網絡模型構建完成。
2.根據權利要求1所述的基于多尺度卷積組與并行的卷積神經網絡圖像去噪方法,其特征在于,所述步驟3具體包括以下步驟:
步驟3.1、設置網絡的超參數,設置網絡初始學習率為0.01~0.0001,并設定在合適的epoch后,學習率降為原來的1/10,其中一個epoch為將訓練集中的圖像都被網絡學習一遍,把訓練集中的圖像分為若干個批,按批來輸入到網絡,一個批的大小為batch_size,其大小根據計算機運行內存而設定;
步驟3.2、步驟2所述的網絡采用殘差學習策略,因此網絡的損失函數設定為:
其中,N為訓練集中原始圖像的數目,xi和yi分別表示訓練集中的原始圖像與對應的噪聲圖像,θ為當前網絡的各個參數值,F(yi;θ)為噪聲圖像輸入到網絡后得到的殘差圖像;
步驟3.3、根據步驟3.2設定的網絡損失函數,優化算法使用自適應時刻估計算法,通過引入可變的學習速率與衰減量來不斷優化步驟3.2中的損失函數,加快收斂速度,并且在一定程度上減少過擬合和欠擬合的情況。
3.根據權利要求1所述的基于多尺度卷積組與并行的卷積神經網絡圖像去噪方法,其特征在于,步驟5的具體實施方式為:選取不在訓練集中的圖像作為原始測試圖像,對原始測試圖像加入固定標準差的高斯白噪聲,其中,噪聲標準差的范圍為σ=[m,n],其中m,n均為正整數,步長為s,s為正整數,可以得到張標準差不同的測試噪聲圖像,將測試噪聲圖像分別輸入到對應噪聲標準差的網絡模型得到去噪圖像,為了檢測網絡的性能,使用峰值信噪比、均方誤差和結構相似性指數這三個參數測量去噪圖像結果從而檢測網絡的性能,其中,PSNR的普遍基準是30dB,其值越大表示圖像趨于無劣化;MSE反映了去噪圖像與原始圖像之間差異程度的一種度量,其值越小表示去噪結果越接近原始圖像;SSIM值的范圍是[0,1],網絡的去噪結果越好,其值越接近1。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安理工大學,未經西安理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910705382.0/1.html,轉載請聲明來源鉆瓜專利網。





