[發明專利]基于Actor-Critic模型的低曝光靜脈圖像增強方法有效
| 申請號: | 202110560691.0 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113269698B | 公開(公告)日: | 2022-01-04 |
| 發明(設計)人: | 王軍;袁靜波;李玉蓮;潘在宇;申政文;陳曉玲 | 申請(專利權)人: | 中國礦業大學 |
| 主分類號: | G06T5/20 | 分類號: | G06T5/20;G06T5/50 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱沉雁 |
| 地址: | 221116 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 actor critic 模型 曝光 靜脈 圖像 增強 方法 | ||
1.一種基于Actor-Critic模型的低曝光靜脈圖像增強方法,其特征在于,步驟如下:
步驟S1、在采集K幅正常光照下的人體手背靜脈圖像,100<K<10000,使用伽馬變化和添加高斯噪聲模擬低光照環境對上述人體手背靜脈圖像逐張進行處理合成低曝光手背靜脈圖像,構成K組圖像對,對上述正常光照下的人體手背靜脈圖像和低曝光手背靜脈圖像逐一進行有效區域提取,得到像素大小為h×w的2K幅靜脈圖像,構成訓練集;
步驟S2、將飽和度、白平衡、色調曲線、對比度函數和曝光函數設置成可微的圖像濾波器;
步驟S3、構建靜脈圖像增強的Actor-Critic模型:
所述Actor-Critic模型包括Critic網絡、判別器網絡和兩個Actor網絡,兩個Actor網絡用于選取濾波順序和參數;Critic網絡用于獲取圖像狀態的獎勵值;判別器網絡用于判斷圖像質量,作為獎勵值計算的輔助;
步驟S3中Actor-Critic模型中的Critic網絡,用于評價濾波處理的優劣,得到圖像的獎勵值;Critic網絡的狀態值函數與Actor網絡的相同,Critic網絡的動作-值函數表示為:
其中,E是期望值;π表示最優的濾波處理策略,t為濾波處理的軌跡;s代表濾波處理后的圖像狀態,s0表示當前輸入圖像的狀態;a代表濾波操作,a0表示初始的濾波操作;Vπ表示狀態值函數;r表示濾波的獎勵值函數;P表示狀態-動作對的概率;
將Qπ代入用于濾波參數更新的Actor網絡的梯度訓練公式,作為π2的監督信號用于訓練網絡;Critic網絡的目標函數Lv為:
其中,v表示Critic網絡的訓練參數,s代表濾波處理后的圖像狀態,ρπ表示狀態分布系數,a表示濾波操作,π(s)表示得到狀態s的策略集,δ表示TD策略評估;TD策略評估用來衡量一個策略的優劣,使Critic網絡進行參數更新,其表達式為:
δ=r(s,a)+γV(P(s,a))-V(s)
其中r表示濾波的獎勵值函數,γ∈[0,1]是一個折現因子,P表示狀態-動作對的概率,V表示TD策略δ的狀態值函數;
步驟S4、利用Actor-Critic模型訓練圖像濾波器得到的一組最優濾波順序和參數:
將訓練集中的正常光照下的人體手背靜脈圖像作為標簽圖像,將低曝光手背靜脈圖像作為輸入圖像,通過Actor-Critic模型對圖像濾波器中的飽和度、白平衡、色調曲線、對比度函數和曝光函數曲線的濾波順序和參數進行迭代更新;通過判別器網絡判斷濾波處理后的圖像與標簽圖像之間的差距,將上述差距輸入到Critic網絡得到圖像的獎勵值,指導Actor網絡對濾波順序和濾波參數的訓練,得到一組最優濾波順序和參數;
步驟S5、采集M幅低曝光的人體手背靜脈圖像,100M<1000;對上述低曝光的人體手背靜脈圖像逐一進行有效區域提取,得到像素大小為h×w的M幅靜脈圖像,作為測試集;
步驟S6、利用Actor-Critic模型訓練圖像濾波器得到的一組最優濾波順序和參數對測試集進行濾波操作,輸出每個濾波操作對應圖像,并提取每個濾波操作對應圖像的互補靜脈細節信息,具體如下:
由于輸出了每個濾波操作對應圖像,其中包含了中間處理過程的圖像;中間處理過程的圖像增強程度不一,細節信息的豐富程度也不同,通過劃分圖像亮暗區域來提取中間處理過程的不同圖像的細節,使不同亮度的區域增強程度不同,達到更準確的增強效果;圖像亮暗區域的劃分和不同區域的梯度權重計算如下式所示:
其中p表示圖像的像素點,T1(p)是圖像中暗區域的梯度權重,T2(p)是圖像中亮區域的梯度權重,Y1(p)是圖像的暗區域的像素亮度值,Y2(p)是圖像亮區域的像素亮度值,θ1和θ2為圖像亮暗區域劃分的閾值;
根據圖像中暗區域和亮區域的梯度權重的平均值構建梯度矢量場,其中水平方向的重建Vh(p)為:
其中Pr表示圖像像素點p右邊的像素點;Gradeh表示水平方向的梯度值;T1()是圖像中暗區域的梯度權重,T2()是圖像中亮區域的梯度權重;
二次損失函數定義為:
其中第一項是平滑項,在細節層產生作用,它的值接近0;第二項是保真度項,用于保留更多的細節信息;參數μ控制向量場光滑程度,μ設置為0.5;Ld為細節項;Vh表示梯度矢量場的水平方向值;x表示坐標軸的x方向,y表示坐標軸的y方向;表示邊緣歸一化項,定義為:
其中q代表梯度敏感值,ε是一個常數;
步驟S7、將提取到的互補靜脈細節信息疊加到Actor-Critic模型選取的濾波操作中最后一次濾波操作處理后的圖像,最終輸出增強后的靜脈圖像。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國礦業大學,未經中國礦業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110560691.0/1.html,轉載請聲明來源鉆瓜專利網。





