[發明專利]圖像稀疏表征多字典學習的聯合優化訓練方法有效
| 申請號: | 201611252617.8 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106815876B | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 陶曉明;黃丹藍;徐邁;葛寧;陸建華 | 申請(專利權)人: | 清華大學;北京航空航天大學 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 樓艮基 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 稀疏 表征 多字 學習 聯合 優化 訓練 方法 | ||
1.圖像稀疏表征多字典學習的聯合優化訓練方法,其特征在于,是一種通過學習圖像中的各向同性圖像的共性得到的共享字典和通過學習圖像中的個性得到的專有字典進行聯合優化訓練方法,以便實現壓縮圖像在保證含有豐富信息量的同時,又能最大限度提高壓縮比,是在計算機中依次按以下步驟實現的:
步驟(1),計算機初始化,設定下述各參數和系數:
將訓練圖像X切分后得到各圖像小塊I為xi的總數,xi∈Rm,m是矩陣R的行,簡稱xi,
圖像小塊xi中的像素用表示,簡寫成j,j=1,2,…,J,同時,j也是像素的序號,J是像素的總數,用u表示所述像素的水平分量,用v表示垂直分量;
用gj表示所述像素j的梯度,用Gi表示所述圖像小塊xi的梯度矩陣,Gi=[g1,g2,…,gJ]T,Gi∈RJ×2,列數n=2,用行數表示像素梯度的數目,在數值上等于像素的總數J,列表示像素梯度的水平與垂直分量,分別用表示;
用ω表示像素j在梯度方向的方向角
用K0表示各向同性子圖像塊的集合,簡稱K0,用D0表示學習K0得到的共享字典;
用K表示各向異性的子圖像塊的集合,K={K1,K2,…,Kk,…,K6},稱為6類梯度方向角的區域,其中,K1對應(0°,30°),K2對應(30°+,60°),K3對應(60°+,90°),K4對應(90°+,120°),K5對應(120°+,150°),K6對應(150°+,180°),其中,30°+表示大于30°,其余類推,符號“{}”表示“含有”元素,下同;
用DK表示學習K后得到的專有字典,簡稱DK,相應地,用D1~D6分別表示對應的學習6個所述梯度角區域的各向異性子圖像塊后得到的6個專有字典,而DK由6個專有字典組成,DK={D1,D2,…,D6}={Dk};
用D表示所述共享字典D0與專有字典Dk的集合,表示為:D={D0,DK}={D0,D1,D2,D3,D4,D5,D6};
用k=1,2,…,6表示各專有字典的下標序列;用k′=0,1,2,3,4,5,6表示字典D中所含有的全部子字典的下標序列;
用A表示字典編碼系數矩陣,A={A0,AK},其中:A0表示所述共享字典D0的編碼系數矩陣,AK表示所述專有字典DK的編碼系數矩陣,其中,表示AK包括:專有字典集合{Dk}中對應于各向異性子圖像塊集合內各個共性圖像那部分的字典的編碼系數矩陣以及6類各向異性子圖像的各專有字典Dk的編碼系數矩陣
各所述編碼系數矩陣的元素稱為編碼系數a,設定編碼系數為聯合優化訓練的參變量之一,其目的在于:在后續研究中,當判定先經步驟(2.3)中目標得到,后又經參數變量聯合優化的壓縮圖像與實際的原輸入圖像在圖像相似度上不滿足誤差要求時,能通過對各編碼系數的調節來提高壓縮圖像與原圖像的相似度,以克服誤差;
用表示共享字典的自相關矩陣,用表示各專有字典的自相關矩陣;用表示所述字典D={D0,D1,D2,D3,D4,D5,D6}中移去任何一個子字典后余下的各個字典的連接矩陣;
用η表示自相關矩陣調節系數序列,包括:
共享字典D0的自相關矩陣的調節系數η0,0<η0<<1,各專有字典Dk的自相關矩陣的調節系數ηk,k=1,2,...,6,0<ηk<1;
用η'表示所述參數的調節系數,k'=0,1,2,...,6,0<η'k'<1,用λ表示對所述字典編碼系數矩陣A進行正則化的正則化系數,0<λ<<1;
步驟(2),從所述xi中提取所述K0和K:
步驟(2.1),從圖像數據庫中隨機選取任意大小相等的訓練圖像,把每一張所述訓練圖像切分為設定數量且大小相等的圖像小塊xi,用向量形式表示為xi∈Rm;
步驟(2.2),求取步驟(2.1)所述xi中各像素j在水平和垂直兩個方向的梯度gj,得到所述xi的梯度矩陣Gi,簡稱Gi,再按式Gi=U∑WT進行奇異值分解,得到:
m×m階酉矩陣U,半正定m×2階對角矩陣Σ∈Rm×2,對角線上的元素稱為奇異值,其中的非零元素代表相應梯度方向的能量大小;2×2階酉矩陣W,W∈R2×2,每個列向量代表所述xi內各像素的梯度方向;
步驟(2.3),用ρ表示梯度方向能量的差值參數,把目標xi中各方向能量相對均衡且比較平穩的子圖像塊作為所述各向同性的子圖像塊,作為共有特征;而把具有明顯方向性的子圖像塊作為所述各向異性的子圖像塊,作為專有特征,根據梯度方向的方向角ω,把所述K分為6個所述的梯度方向角區域,ρ在(0,1)間取值,Σ1,1,Σ2,2為兩個所述梯度方向各自對應的奇異值;
步驟(3),對所述共享字典D0和專有字典Dk按以下步驟進行聯合優化訓練:
設聯合優化的目標函數為:
其中,dj是單位向量,表示矩陣Di的列向量;表示求使得目標函數最小的變量Di,Ai的取值;[D0,Dk]表示將矩陣D0與Dk橫向拼接起來成一個大矩陣;||.||F表示矩陣的Frobenius范數;||.||0表示矩陣的L0范數,即非零元素的個數;Qk′是對應于自相關矩陣的單位矩陣;||.||2是向量的歐幾里得范數;
步驟(3.1),用遞歸最小二乘字典學習算法RLA_DLA對所述D0和Dk進行初始化;即對所述各向同性的子圖像塊進行字典學習,得到初始化的共享字典D0,及其所對應的初始化的編碼系數矩陣A0對所述各向異性的子圖像塊Kk,k=1,...,6分別進行字典學習,得到初始化的專有字典Dk,k=1,...,6,及其所對應的初始化的編碼系數矩陣
步驟(3.2),求解所述專有字典Dk及對應的
步驟(3.2.1),改變步驟(3)中出現的聯合優化訓練的目標函數的表達形式:找出并忽略常數項,保留Dk,項,交替求解;
步驟(3.2.1.1),表示所述各向同性子圖像塊集合K0用共享字典D0進行稀疏表征后的殘差,所述殘差項為常數,不影響目標函數取值,可忽略;
步驟(3.2.1.2),由于A={A0,AK},因而在λ||A||0項中,忽略A0及項,就簡化為
步驟(3.2.1.3),改寫
被改寫項表示第Kk個梯度方向角區域內各個各向異性子圖像塊Kk用相對應的編碼系數矩陣調節后的共享字典D0和相對應的編碼系數矩陣調節后的專有字典Dk共同進行稀疏表征后的殘差;同理,能把項改寫為令因而得到的被改寫結果的表達式為:
步驟(3.2.1.3),得到改變后的所述聯合優化訓練的目標函數:
其中,k=1,2,...,6,λ,ηk,η'k'均為設定值;
步驟(3.2.2),求解各專有字典的編碼系數矩陣
步驟(3.2.2.1),僅保留與所述編碼系數矩陣相關的項,忽略其他項,
步驟(3.2.2.2),在Dk不變的條件下,得到用于求解所述編碼系數矩陣的目標函數:
步驟(3.2.2.3),設定稀疏度L,根據已知的Kk和D0,用正交匹配追蹤算法OMP求得從而得到Yk;帶入步驟(3.2.2.2)的目標函數中得到對應的
步驟(3.2.3),求解專有字典DK={D1,D2,...,D6}:
步驟(3.2.3.1),在步驟(3.2.1.3)所述聯合優化訓練的目標函數中,忽略常數項保留與各專有字典Dk相關的項,得到:
步驟(3.2.3.2),按以下步驟求出聯合優化訓練后的各專有字典D'k:
步驟(3.2.3.2.1)令:dγ表示Dk的列向量,稱為字典原子,γ為所述列向量的序號,
步驟(3.2.3.2.2),用下述梯度下降法更新專有字典Dk的列向量dγ,更新后得到的d′γ即為專有字典D'k的列向量:
k=1,2,…,6,符號表示對變量求導,aγ表示系數矩陣的第γ行,得到:ζ1為步長;步長ζ1由armijo準則確定,所述armijo準則,是一維搜索步長的算法;
步驟(3.3),求解共享字典D0:
步驟(3.3.1),改變步驟(3)中聯合優化訓練的目標函數的表達形式:
步驟(3.3.1.1),把各Dk及相關的自相關調節系數序列ηk,互相關調節系數η'k',各專有字典編碼系數矩陣視為常數,且A={A0,AK},保留D0,
步驟(3.3.1.2)改寫下述各項表達式
改寫為:
改寫為:
改寫為和
λ||A||0改寫為還有一項λ||A0||0;
步驟(3.3.1.3),改寫后的所述聯合優化訓練目標函數為:
步驟(3.3.1.4),按步驟(3.3.1.3)求解A0:
固定更新后的各專有字典D′k,令Dk=D′k,保持D0不變,得到用于求解A0的所述聯合優化訓練目標函數:
用步驟(3.2.2.3)所述的正交匹配追蹤算法OMP算法求得A0;
步驟(3.3.1.5),按照步驟(3.3.1.3)提出的所述聯合優化訓練目標函數求解在Zk,A0,D0不變的條件下,除了和得以保留外,忽略其他項,得到用于求解的所述聯合優化訓練目標函數:
用與步驟(3.3.1.4)相同的方法求出
步驟(3.3.1.6),按步驟(3.3.1.3)提出的所述聯合優化訓練目標函數求解D0:
步驟(3.3.1.6.1),固定更新后的專門化字典D′k,保留與共享字典D0相關的項,得到求解D0的所述聯合優化訓練目標函數:
其中,D-0表示所有的專有字典橫向拼接起來的矩陣,其表達式為D-0=[D′1,D′2,…,D′6];
步驟(3.3.1.6.2),用步驟(3.2.3.4)所述的梯度下降算法,再次更新步驟(3.2.3.2.2)中得到的專有字典D'k和字典原子dγ',得到了再次更新后的字典原子dγ”為列向量構成的專有字典D″k,得到:
其中:表示中的第γ′行,ζ2表示步長,由步驟(3.2.3.4)中所述armijo準則確定。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;北京航空航天大學,未經清華大學;北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611252617.8/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





