[發明專利]基于無監督學習的單張圖片本征圖像分解方法、系統及介質有效
| 申請號: | 202110395059.5 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113077451B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 周錦;張青;孫偉;鄭偉詩;席楊 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06N3/0464;G06N3/084 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 李斌 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 學習 單張 圖片 圖像 分解 方法 系統 介質 | ||
1.基于無監督學習的單張圖片本征圖像分解方法,其特征在于,包括下述步驟:
構建本征圖像分解模型,所述本征圖像分解模型包括兩個分支,一支為反射率生成網絡,另一支為光照生成網絡;設置隨機噪聲參數并經過訓練后得到兩個與原圖尺度相同的隨機噪聲;
將生成的兩個隨機噪聲分別作為反射率網絡和光照網絡的輸入,在損失函數的約束下,不斷利用反向傳播算法更新反射率網絡和光照網絡的參數;
所述在損失函數的約束下,不斷利用反向傳播算法更新反射率網絡和光照網絡的參數,具體為:
重構誤差,所述反射率生成網絡和光照生成網絡分別輸出反射率和光照,根據Retinex理論,圖像模型表示為:
I=r·s,(1)
其中,r表示反射率,s表示光照,I表示原圖,要滿足Retinex理論,即網絡的兩個輸出需要滿足(1)等式的約束,因此重構誤差表示為:
其中,R表示網絡輸出的反射率,S表示本方法網絡輸出的光照,為了將網絡的兩個分支解耦,使其學習過程相對獨立,把原Retinex理論轉化到了log域,表達式從乘積式子變成和式;
互斥誤差,在梯度域設置一個損失項以區分開反射率和光照,在多種尺度上計算互斥損失項,具體為:
其中,θ表示網絡的參數;n表示下采樣的系數;fS,fR分別表示輸出光照的網絡分支和輸出反射率的網絡分支,fS,fR使用雙線性插值法下采樣2n-1;||·||F表示Frobenius范數;⊙表示點乘;
本征圖像分解模型訓練,以生成的兩個隨機噪聲為輸入,在訓練M1次循環之后在兩個初始隨機噪聲的基礎上分別添加擾動,然后分別作為反射率生成網絡和光照生成網絡最終的網絡輸入;訓練本征圖像分解模型使用的目標函數為重構誤差和互斥誤差;使用Adam優化器更新反射率生成網絡和光照生成網絡的參數;各分支網絡的初始化均采用澤維爾初始化;當更新反射率網絡和光照網絡的參數多次后,在歷史輸出中選取重構圖與原圖峰值信噪比PSNR值最小的那組結果作為本征圖像分解的最終結果。
2.根據權利要求1所述基于無監督學習的單張圖片本征圖像分解方法,其特征在于,所述反射率網絡和光照網絡結構相同,具體為:
前五層是Encoder部分,每層卷積層的頻道數相比前一層增加一倍,第一層的頻道數設置為8,每層卷積層的卷積核大小都是3*3,步長設置為2;
后五層是decoder部分,每層卷積層的頻道數相比前一層減少一半,第六層的頻道數設置為128;每層卷積層的卷積核大小都是3*3,步長設置為2;第七層和第八層分別與第三層和第四層連接,用于保存淺層的信息。
3.根據權利要求1所述基于無監督學習的單張圖片本征圖像分解方法,其特征在于,所述設置隨機噪聲參數并經過訓練后得到兩個與原圖尺度相同的隨機噪聲,具體為:
設置噪聲為取值在[-0.5,0.5]之間的滿足均勻分布的隨機變量,隨機噪聲生成后就固定為反射率生成網絡或者光照生成網絡的輸入了,在網絡訓練至M0個循環之后,每個循環的網絡輸入開始加擾動,以改善網絡模型的穩定性;擾動為服從均值為0,方差為1的正態分布的隨機變量,擾動乘上系數0.001之后加上原始網絡輸入構成最終的網絡輸入。
4.根據權利要求3所述基于無監督學習的單張圖片本征圖像分解方法,其特征在于,所述M0為1000。
5.根據權利要求1所述基于無監督學習的單張圖片本征圖像分解方法,其特征在于,在互斥誤差的步驟中,設置N=3,
6.根據權利要求1所述基于無監督學習的單張圖片本征圖像分解方法,其特征在于,所述M1取值為10000。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110395059.5/1.html,轉載請聲明來源鉆瓜專利網。





