[發明專利]基于最優停止理論的編碼模式快速自動選擇方法無效
| 申請號: | 201210435266.X | 申請日: | 2012-11-02 |
| 公開(公告)號: | CN102957932A | 公開(公告)日: | 2013-03-06 |
| 發明(設計)人: | 王瀚漓;衡岳 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | H04N13/00 | 分類號: | H04N13/00;H04N7/26 |
| 代理公司: | 上海科盛知識產權代理有限公司 31225 | 代理人: | 趙繼明 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 最優 停止 理論 編碼 模式 快速 自動 選擇 方法 | ||
技術領域
本發明涉及一種視頻編碼方法,尤其是涉及一種基于最優停止理論的編碼模式快速自動選擇方法。
背景技術
隨著人們對視覺體驗的要求越來越高,市場上出現了三維電視(3DTV)和自由視點電視(FTV)等新興電子設備,多視點視頻編碼標準Multi-view?Video?Coding(MVC)應運而生。MVC通過一組攝像頭從不同角度對同一場景進行拍攝,得到的視頻數據為3DTV和FTV提供視頻源數據。
一般來說,視頻序列中存在大量的冗余信息,主要分為以下三種:空間冗余信息、時間冗余信息和統計冗余信息。視頻編碼技術通過有效合理地去除這些冗余信息,從而達到視頻壓縮的目的。在視頻編碼中,一般通過幀間編碼技術對Predicted?frames(P幀)和Bi-directional?predictive?frames(B幀)進行編碼。B、P幀與前后幀之間存在大量相似內容:編碼B幀時,通過參考前后兩個方向的已編碼幀來去除時間冗余;編碼P幀時,只參考前面一個方向的已編碼幀;以上方法可以去除大量的時間冗余信息。一般通過幀內編碼技術對Intra?coded?frames(I幀)進行編碼,I幀不參考其他幀的信息,只利用自身的信息進行編碼。由于相鄰像素之間像素值緊密相關,可以通過鄰近像素對當前像素進行預測以去除空間冗余信息。對于預測之后得到的殘差信號利用信源的統計信息進行變換、量化和熵編碼,從而進行高效壓縮。
和H.264/AVC單視點視頻編碼標準相比,MVC必須處理和攝像機數量成比例的數據量,這個數據量是極大的。在網絡帶寬等系統資源有限的情況下,如何有效處理如此巨大的數據量成為MVC應用的一個瓶頸。
除了前面所提的三種冗余信息外,MVC還存在著一種不可忽視的冗余信息,即為視差冗余信息。由于每個攝像頭都是對同一場景進行拍攝,所不同的僅僅是對場景的取景角度,所以不同攝像頭所得到的視頻序列間存在大量相似信息。對于視差冗余信息,一般利用視差估計來去除視差冗余信息。
作為H.264/AVC的擴展,MVC中宏塊大小的劃分也是靈活可變的。在MVC中,有7種宏塊劃分大小,分別是:16×16(像素為單位)、16×8、8×16、8×8、8×4、4×8、4×4,如圖1所示。
一般對于細節較少、圖像變化較平緩的區域,選擇的塊尺寸會大一些;對于圖像中細節較多的區域選擇的塊尺寸會小一些。對幀間預測而言,每個宏塊都要進行運動估計,并且相應地有一個運動矢量,也就是空間位置的相對偏移量,在解碼端通過運動矢量指明的位置,從已經解碼得到的鄰近參考幀中得到對應的塊,和預測殘差相加后就得到所需要解碼的塊。另外,如果宏塊進行視差估計,會相應地有一個視差矢量,視差是指同一個點在不同視點的對應圖像中投影點之間的位置偏差,包括各攝像機的相對運動及場景中對象的運動所產生的差異。在解碼端通過視差矢量,可以從參考視點的對應宏塊得到所要解碼的宏塊。如果宏塊劃分地很細致,那么所得到的子塊數量會增多,相應的運動矢量/視差矢量也會增多,用來表示運動矢量/視差矢量的比特數也相應地增加,需編碼的視頻信息量就會變大,所以如何選擇宏塊尺寸大小就顯得極為重要。
在視頻編碼中,不僅存在不同大小的宏塊,每一個宏塊還有Intra,Inter,SKIP三種可選編碼方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三種。對宏塊的亮度分量而言,Intra4×4和Intra8×8分別有9種預測方向,分別是:垂直預測、水平預測、平均預測、左對角預測、右對角預測、垂直右對角預測、水平向下預測、垂直左對角預測和水平向上預測。對于Intra16×16存在4種預測方向,分別是:水平預測、垂直預測、平均預測和平面預測。對于宏塊的Intra8×8色度塊預測,存在的4種預測方向和Intra16×16的4種預測方向相同,并且兩種色度成分常用同一種預測方向。
在如此眾多的預測方式中,如何選擇最佳方式對當前宏塊進行編碼是極為重要的。最簡單的方法是遍歷所有模式,從中選出一個最佳的方式,這樣就存在一個選擇標準。在MVC中,采用拉格朗日率失真優化策略(Rate?Distortion?Optimization,RDO)作為評價準則,即通過遍歷所有可能的模式,最后選擇率失真代價最小的模式作為最佳編碼模式,公式為:
J(s,c,m|QP,λm)=D(s,c,m|QP)+λmR(s,c,m|QP)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210435266.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種頭帶式耳機
- 下一篇:一種圖像處理方法、裝置及系統





