[發明專利]用于視頻幀內編碼的KLT矩陣訓練方法無效

申請號：	200910060558.8	申請日：	2009-01-16
公開（公告）號：	CN101489134A	公開（公告）日：	2009-07-22
發明（設計）人：	余勝生;高毅;陳加忠;郭紅星;孫偉平;陳小平;黎單	申請（專利權）人：	華中科技大學
主分類號：	H04N7/26	分類號：	H04N7/26;H04N7/32
代理公司：	華中科技大學專利中心	代理人：	曹葆青
地址：	430074湖北***	國省代碼：	湖北;42
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于視頻編碼 klt 矩陣訓練方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及信號處理中的視頻編碼技術領域，特別是針對幀內預測的殘差信號訓練出具有良好變換性能的KLT矩陣。

背景技術

H.264/AVC是ITU-T的視頻編碼專家和ISO/IEC的運動圖像專家組聯合提出的最新視頻編碼標準。同以往編碼標準(如H.261，H.263，MPEG-1，MPEG-2，MPEG-4等)一樣，H.264/AVC也采用混合編碼框架，在進行編碼時，首先將視頻圖像劃分成多個宏塊，然后以宏塊為單位進行預測、變換以及熵編碼。

預測包括幀內預測和幀間預測。幀內預測可以消除視頻序列空間上的相關性，而幀間預測可以消除視頻序列時間上的相關性。預測完畢，殘差數據仍然存在空間冗余，必須進行變換以消除數據中的相關性，使得量化后的系數易于進行熵編碼，從而提高壓縮效率。

H.264/AVC的幀內預測技術是基于空間域的，即根據相鄰宏塊的像素的重構值來預測當前宏塊。H.264/AVC分別定義了兩種亮度預測塊尺寸(4×4和16×16)和一種色度尺寸(8×8)。其中，對于4×4的預測塊共定義了9種預測模式，而對于16×16的亮度塊和8×8的色度塊則只定義了5種預測模式。4×4的預測塊尺寸適合于具有豐富紋理特征的區域，而16×16的預測塊尺寸適合光滑的區域。對預測后的殘差系數進行4×4的整數DCT變換，變換矩陣定義如下：

H=111121-1-21-1-111-22-1.]]>

對變換系數進行量化，并將Zig-zag掃描后的系數進行熵編碼。最優的預測塊尺寸和預測模式的選擇是根據率失真優化公式進行選擇。

DCT的變換性能接近于最優變換，并且變換性能不依賴于信號，因此在視頻和圖像編碼標準中得到廣泛應用。不過，由于不同的幀內預測模式的殘差信號具有不同的能量分布特征，采用變換矩陣固定的DCT難以獲得理想的變換性能。

KLT(Karhunen-Loève?transform)是均方差意義下的最優變換。另外，由于KLT的變換矩陣是通過對樣本進行訓練獲得，因此，具有變換矩陣靈活的特點。不過，KLT的變換性能依賴于數據本身。已有研究表明，對于同一類輸入信號，最差KLT矩陣和最優KLT矩陣的變換性能差距可以達到3dB以上。因此，現有的數據壓縮應用中，編碼端都是實時訓練KLT矩陣并將其傳輸到解碼端(通過把KLT矩陣寫入壓縮的數據流或者是獨立傳輸KLT矩陣)。不過，KLT矩陣的訓練過程計算復雜度很高，而且需要額外的信息量表示訓練出的KLT矩陣，因此，實時訓練KLT矩陣的方法難以適合于視頻編碼這類應用。

發明內容

本發明的目的在于提供一種用于視頻幀內編碼的KLT矩陣訓練方法，避免了實時訓練KLT矩陣的巨大計算量，減少了用于表示KLT矩陣的額外比特開銷，訓練得到的矩陣具有良好的變換性能。

基于視頻幀內編碼的KLT矩陣訓練方法，分別在各種幀內預測模式下，按照如下方法進行矩陣訓練：

(1)提取幀內預測模式P的殘差樣本頻譜；

(2)對殘差樣本集進行分組，對分組得到的每一個樣本組采用傳統KLT矩陣訓練方法得到一個M×M維的候選KLT矩陣；

(3)按照如下方法優化各候選KLT矩陣：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于華中科技大學，未經華中科技大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200910060558.8/2.html，轉載請聲明來源鉆瓜專利網。