[發明專利]基于最優停止理論的編碼模式快速自動選擇方法無效

申請號：	201210435266.X	申請日：	2012-11-02
公開（公告）號：	CN102957932A	公開（公告）日：	2013-03-06
發明（設計）人：	王瀚漓;衡岳	申請（專利權）人：	同濟大學
主分類號：	H04N13/00	分類號：	H04N13/00;H04N7/26
代理公司：	上海科盛知識產權代理有限公司 31225	代理人：	趙繼明
地址：	200092 ***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于最優停止理論編碼模式快速自動選擇方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明涉及一種視頻編碼方法，尤其是涉及一種基于最優停止理論的編碼模式快速自動選擇方法。

背景技術

隨著人們對視覺體驗的要求越來越高，市場上出現了三維電視(3DTV)和自由視點電視(FTV)等新興電子設備，多視點視頻編碼標準Multi-view?Video?Coding(MVC)應運而生。MVC通過一組攝像頭從不同角度對同一場景進行拍攝，得到的視頻數據為3DTV和FTV提供視頻源數據。

一般來說，視頻序列中存在大量的冗余信息，主要分為以下三種：空間冗余信息、時間冗余信息和統計冗余信息。視頻編碼技術通過有效合理地去除這些冗余信息，從而達到視頻壓縮的目的。在視頻編碼中，一般通過幀間編碼技術對Predicted?frames(P幀)和Bi-directional?predictive?frames(B幀)進行編碼。B、P幀與前后幀之間存在大量相似內容：編碼B幀時，通過參考前后兩個方向的已編碼幀來去除時間冗余；編碼P幀時，只參考前面一個方向的已編碼幀；以上方法可以去除大量的時間冗余信息。一般通過幀內編碼技術對Intra?coded?frames(I幀)進行編碼，I幀不參考其他幀的信息，只利用自身的信息進行編碼。由于相鄰像素之間像素值緊密相關，可以通過鄰近像素對當前像素進行預測以去除空間冗余信息。對于預測之后得到的殘差信號利用信源的統計信息進行變換、量化和熵編碼，從而進行高效壓縮。

和H.264/AVC單視點視頻編碼標準相比，MVC必須處理和攝像機數量成比例的數據量，這個數據量是極大的。在網絡帶寬等系統資源有限的情況下，如何有效處理如此巨大的數據量成為MVC應用的一個瓶頸。

除了前面所提的三種冗余信息外，MVC還存在著一種不可忽視的冗余信息，即為視差冗余信息。由于每個攝像頭都是對同一場景進行拍攝，所不同的僅僅是對場景的取景角度，所以不同攝像頭所得到的視頻序列間存在大量相似信息。對于視差冗余信息，一般利用視差估計來去除視差冗余信息。

作為H.264/AVC的擴展，MVC中宏塊大小的劃分也是靈活可變的。在MVC中，有7種宏塊劃分大小，分別是：16×16(像素為單位)、16×8、8×16、8×8、8×4、4×8、4×4，如圖1所示。

一般對于細節較少、圖像變化較平緩的區域，選擇的塊尺寸會大一些；對于圖像中細節較多的區域選擇的塊尺寸會小一些。對幀間預測而言，每個宏塊都要進行運動估計，并且相應地有一個運動矢量，也就是空間位置的相對偏移量，在解碼端通過運動矢量指明的位置，從已經解碼得到的鄰近參考幀中得到對應的塊，和預測殘差相加后就得到所需要解碼的塊。另外，如果宏塊進行視差估計，會相應地有一個視差矢量，視差是指同一個點在不同視點的對應圖像中投影點之間的位置偏差，包括各攝像機的相對運動及場景中對象的運動所產生的差異。在解碼端通過視差矢量，可以從參考視點的對應宏塊得到所要解碼的宏塊。如果宏塊劃分地很細致，那么所得到的子塊數量會增多，相應的運動矢量/視差矢量也會增多，用來表示運動矢量/視差矢量的比特數也相應地增加，需編碼的視頻信息量就會變大，所以如何選擇宏塊尺寸大小就顯得極為重要。

在視頻編碼中，不僅存在不同大小的宏塊，每一個宏塊還有Intra，Inter，SKIP三種可選編碼方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三種。對宏塊的亮度分量而言，Intra4×4和Intra8×8分別有9種預測方向，分別是：垂直預測、水平預測、平均預測、左對角預測、右對角預測、垂直右對角預測、水平向下預測、垂直左對角預測和水平向上預測。對于Intra16×16存在4種預測方向，分別是：水平預測、垂直預測、平均預測和平面預測。對于宏塊的Intra8×8色度塊預測，存在的4種預測方向和Intra16×16的4種預測方向相同，并且兩種色度成分常用同一種預測方向。

在如此眾多的預測方式中，如何選擇最佳方式對當前宏塊進行編碼是極為重要的。最簡單的方法是遍歷所有模式，從中選出一個最佳的方式，這樣就存在一個選擇標準。在MVC中，采用拉格朗日率失真優化策略(Rate?Distortion?Optimization，RDO)作為評價準則，即通過遍歷所有可能的模式，最后選擇率失真代價最小的模式作為最佳編碼模式，公式為：

J(s，c，m|QP，λ_m)＝D(s，c，m|QP)+λ_mR(s，c，m|QP)

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于同濟大學，未經同濟大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210435266.X/2.html，轉載請聲明來源鉆瓜專利網。