[發明專利]優化的層式離散余弦變換編碼方法無效
| 申請號: | 200710056633.4 | 申請日: | 2007-01-26 |
| 公開(公告)號: | CN101141640A | 公開(公告)日: | 2008-03-12 |
| 發明(設計)人: | 張寶菊;賈萍;李彥;陳勁;孫景瑞 | 申請(專利權)人: | 天津師范大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300387天津市西青區賓水西*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 優化 離散 余弦 變換 編碼 方法 | ||
技術領域
本發明涉及一種數字圖像、數字視頻壓縮編碼技術,特別涉及一種適合于“多路環境”或漸進式傳輸的具有多分辨力特性的離散余弦變換編碼方法。
背景技術
目前,具有多分辨力特性的離散余弦變換(discrete?cosine?transform,DCT)編碼方法有Xiong等提出的嵌入式EZ-DCT編碼(Xiong?Z,GULERYUZ?O,ORCHARD?M.ADCT-based?embedded?image?coder[J].IEEE?Signal?Processing?Letters,1996,3(11):289-290.),在此基礎上對DCT系數進行重組的層次嵌入式零樹EZH-DCT編碼(趙德斌,張大鵬,高文.基于層次DCT變換的嵌入式圖像編碼方法[J].軟件學報,2001,12(9):1287-1293.)以及Kuan?HuiTan和Mohammad?Gharbari提出的DCT塔式結構(K.Hui,Mohammad?Ghanbari.Layered?Image?Coding?Using?the?DCT?Pyramid[J].IEEETransactions?on?Image?Processing,1995,4(4):512-516.)。嵌入式EZ-DCT是將圖像DCT后的系數劃分為不同的層,采用零樹小波編碼的方法進行量化編碼,算法簡單,但壓縮性能不好。層次EZH-DCT利用了圖像DCT后直流系數的相關性,對具有相關性的直流系數進一步DCT處理,大大提高了圖像的壓縮率,但這些直流系數集中了圖像的大部分能量,對于重構圖像的質量起著極其重要的作用,這些系數的失真會嚴重影響重構圖像的質量。
DCT被廣泛應用于圖像編碼,一般將圖像分為8×8的小塊,DCT獨立作用于每個小塊上,這樣在壓縮率比較高時,塊與塊圖像間會產生亮度落差,即方塊效應。DCT塔式結構(又稱層式DCT)具有較高的壓縮質量,可以有效地減小DCT先天性的方塊效應,這主要是因為:經過系數重組后,本層輸入圖因DCT分塊而產生的邊界有一半落入更高一層輸入圖的DCT分塊內,于是原來由這些邊界產生的方塊效應被消除。但是,其編碼效率還有待進一步提高,編碼方案有待進一步簡化。
發明內容
本發明是為解決上述問題進行的研究,其目的是提供一種簡化編碼、進一步提高圖像的壓縮效率和質量的、用于圖像/視頻網絡傳輸的優化的層式離散余弦變換編碼方法。
本發明解決該技術問題采用的技術方案是:對層式DCT的頂層數據不再進行DCT變換編碼,而是將頂層數據直接存儲或傳輸,在解碼過程中也相應地略去了逆離散余弦變換(inverse?discrete?cosine?transform,IDCT)的過程。
具體編碼步驟如下:
(1)編碼器讀入原圖像數據,對編碼器第一層的輸入數據即原圖像,進行N×NDCT變換;
(2)將每個DCT塊均分為4個子塊,把具有相同頻帶的子塊按原來的空間位置組合成同頻子帶,輸入圖像被分成4部分:LL,LH,HL和HH,這四部分分別保持了圖像的低頻信息,水平方向、豎直方向和對角線方向上的高頻細節信息;
(3)對低頻LL子帶作(N/2)×(N/2)IDCT變換,得到的數據作為第二層的輸入數據;剩下的形成倒L形狀的高頻子帶視為第一層數據;
(4)對第二層的輸入數據作相同變換,產生新的數據即第二層數據又作為第三層的輸入數據,依次循環變換下去,直到滿足要求的層數;
(5)對最后一層的輸入數據不進行任何處理,直接作為頂層數據,編碼過程結束。
解碼步驟如下:
(1)解碼器讀入接收到的圖像數據,對輸入的頂層數據進行(N/2)×(N/2)DCT變換;
(2)將變換后的頂層數據與低一層數據進行系數插值處理,即對頂層的低頻系數進行上采樣,插入的數值為低一層所保留的高頻細節信息;
(3)對完成系數插值操作后的數據進行N×NIDCT變換,并將其作為低一層的輸入數據;
(4)對次高層數據進行(N/2)×(N/2)DCT變換,將變換后數據與更低一層數據進行插值操作,依次循環變換下去,直到圖像插值為第一層所保留的高頻細節信息;
(5)對第一層圖像數據進行N×NIDCT變換,得到重構圖像,至此解碼過程結束。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津師范大學,未經天津師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710056633.4/2.html,轉載請聲明來源鉆瓜專利網。





