[發明專利]圖像稀疏表征多字典學習的聯合優化訓練方法有效
| 申請號: | 201611252617.8 | 申請日: | 2016-12-30 |
| 公開(公告)號: | CN106815876B | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 陶曉明;黃丹藍;徐邁;葛寧;陸建華 | 申請(專利權)人: | 清華大學;北京航空航天大學 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 樓艮基 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 稀疏 表征 多字 學習 聯合 優化 訓練 方法 | ||
圖像稀疏表征多字典學習聯合優化訓練方法,屬于多媒體通信和圖像數據處理領域,其特征在于,把訓練用圖像單元的梯度矩陣經奇異值分解后的奇異值矩陣中的非零元素視作對應梯度方向的能量值,根據設定的能量值參數門限把圖像單元分為各項同性圖像和各項異性圖像,依次學習共享字典和專門化字典,用一個反映經稀疏表征后的各向同性和各向異性圖像的殘差,各字典的自相關和互相關程度以及非零元素正則化等因素最小化的目標函數予以優化,在優化過程中,依次用正交匹配追蹤算法優化A0,Ak,再用梯度下降算法優化D0,Dk,在保留欲優化參數時,其他不涉及欲優化參數的項視為常數。本發明用于圖像壓縮時,細節保留好,失真率較低,圖像品質相對較好。
技術領域
本發明提供了一種圖像數據壓縮方法,屬于多媒體通信和數據壓縮交叉領域,特別設計一種針對低碼率的圖像數據壓縮算法,對圖像紋理進行聚類與結構化字典建模,將圖像進行稀疏表征,主要用于降低通信時傳輸的數據量,既適用于特定主題的圖像如人臉,又適用于一般的自然圖像,應用廣泛。
背景技術
數字多媒體通信是當前通信技術眾多領域中最具挑戰性、發展最快的領域之一。大數據時代對數據的壓縮和傳輸提出了更高的需求。為了有效減輕帶寬壓力,對數據進行有效傳輸,圖像壓縮被研究者們廣泛的研究。
傳統的圖像壓縮方法在低碼率時不能對圖像產生良好的壓縮效果,在低碼率時,恢復圖像難以產生較好的視覺效果。如基于離散余弦變換(DCT)的JPEG圖像壓縮方法在重建時會產生較明顯的塊效應,圖像塊進行變換編碼,隨著碼率的降低,在塊的邊界出現了不連續。基于離散小波變換(DWT)的JPEG2000壓縮方法將高頻的小波系數進行了閾值收縮,造成了高頻信息的丟失,會對圖像產生振鈴現象,其典型表現是圖像灰度劇烈變化的領域出現類似吉伯斯分布的震蕩,嚴重影響復原圖像的質量,并且使得后續圖像處理難以進行。
近年來,字典學習方法取得了較好的壓縮效果,即將數據(圖像)用一組基的稀疏的線性組合的基來表示,所述字典,指的是“基”。與離散余弦變換和小波變換相同,字典學習也是根據基進行變換,在變換域中對圖像進行表征,以求取得比像素域更優越的表達效果,即在變換域能用更少的比特來表征圖像,實現圖像壓縮。在這里,字典這組基所對應的系數是稀疏的,大部分為零,只有少部分非零系數,利用這種優越的性質對圖像進行稀疏編碼(Sparse Coding,SC)。其不同之處在于,離散余弦基與小波基是根據數學函數得到的基,而字典學習的基,是從實際圖像中用機器學習的算法學習得到的。這樣做的好處在于,從實際樣本中學出來的基更吻合圖像,而根據數學函數得到的基難以完美的刻畫圖像的規律。字典學習的原理在于,對訓練集的圖像學習得到一組冗余基,所述冗余基,指字典的原子(即字典的一列)個數大于其維數,有理論保障,測試集中的樣本可以用該冗余基的少數幾個分量線性組合來唯一地表示,稱這種表示為稀疏表征。稀疏表征旨在用最少的字典原子表示一個信號,以實現將圖像用少數數據來表示,達到數據壓縮的目的。經典的字典學習算法有K-SVD,每次學習更新一個原子和其對應的稀疏系數,直到所有的原子更新完畢,重復迭代幾次即可求出過完備字典。該算法的不足在于,字典訓練的時間較長。于是,有研究提出在線字典學習算法(Online Dictionary Learning),該方法通過隨機梯度下降算法達到最優值,幾次迭代即可求出字典,能更快地收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;北京航空航天大學,未經清華大學;北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611252617.8/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





