[發明專利]視頻編碼中快速的模式確定方法和裝置無效
| 申請號: | 200710048114.3 | 申請日: | 2007-11-13 |
| 公開(公告)號: | CN101150722A | 公開(公告)日: | 2008-03-26 |
| 發明(設計)人: | 王淑慧;林濤 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26 |
| 代理公司: | 上海光華專利事務所 | 代理人: | 余明偉 |
| 地址: | 200092上*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 編碼 快速 模式 確定 方法 裝置 | ||
技術領域
本發明涉及到視頻編碼系統采用多模式編碼時的編碼過程,特別是涉及到確定最佳幀間模式的方法和裝置。
背景技術
在許多視頻壓縮標準(如H.264)中,為了獲得更好的壓縮效果,廣泛采用了多模式(multi-mode)的編碼方法。如H.264中采用了幀內(intra)編碼和幀間(inter)編碼方法,而幀內編碼和幀間編碼又進一步細分為各種不同的編碼子模式。在眾多模式中選擇最佳模式的準則是碼率-失真最優化,簡寫為RD最優化(RD?optimization),其中R代表碼率(bit-rate),即編碼所用的位數(比特數),D代表編碼失真(Distortion)。RD最優化是通過一個RD成本函數(或簡稱成本函數)實現的。對應每種編碼模式都有相應的成本函數值,而取得最小成本函數值的模式即為最佳模式。通過采用RD最優化的方法,可在復原圖像質量和壓縮效率之間做一個最好的折中,但在多種編碼模式中搜索最佳模式的過程明顯增加了編碼器的復雜性和計算量。
圖像按宏塊編碼的方式:
在視頻壓縮標準中,一幅圖像被分成宏塊(macroblock)組,宏塊是16×16(像素)大小的正方形區域。如圖1所示,以176×144大小的圖像為例,一幅圖像共包含99個宏塊。
編碼模式介紹:
視頻壓縮的可行性主要基于視頻序列本身的特點。對視頻序列來說,同一幅圖像的鄰近像素之間具有很強的空間相關性,而相繼圖像之間則具有很強的時間相關性,于是可采用合適的方法去除這種相關性,達到壓縮數據的目的。在視頻壓縮標準中廣泛采用的方法為預測編碼,即用以前已編碼過的像素來預測當前編碼塊的像素值,得到預測塊,然后算出由當前編碼塊與預測塊的差值構成的預測誤差塊,接下來對預測誤差塊進行后續的編碼過程,即變換編碼和量化以及熵編碼。在此作以下三個定義:
1、原始編碼塊中的像素與對應預測塊中相應位置像素的差值稱為參差。
2、原始編碼塊與對應預測塊的差值構成的預測誤差塊稱參差塊。
3、參差塊包含的各個數值稱為參差數據。
相比原始編碼塊而言,參差塊具有較小的相關性和較低的能量,因此對其編碼所用的比特數比對原始編碼塊直接編碼明顯減少。預測編碼的分類從大的方面講有兩種,即幀內(intra)預測及幀間(inter)預測。幀內預測用同一幅圖像內已編過碼的鄰近塊內的像素來預測當前編碼塊的內容,而幀間預測則是用時間上鄰近的其他編碼過的圖像(稱為參考圖像)內的像素塊來預測當前編碼塊的內容,在此我們稱通過幀間預測得到的預測塊為幀間預測塊,而通過幀內預測得到的預測塊為幀內預測塊。對幀間預測來說,在已編碼過的圖像中搜索與當前塊最匹配的塊的過程稱為運動估計,運動估計主要是為了得到當前塊在參考圖像內的最匹配的位置,指示其相對位置的矢量稱為運動矢量。在運動估計過程中,每個宏塊還可進一步劃分為更小的子塊,對每個子塊都要搜索最匹配塊,所以劃分子塊的個數越多,搜索的過程越復雜。每一種劃分方法稱為一種編碼模式,可以有圖2所示的劃分方法。
圖2中,16×16大小的宏塊進一步劃分為不同大小的子塊,圖2(b)中對應兩個16×8的劃分,而圖2(c)中對應兩個8×16的劃分,而圖2(d)中對應四個8×8的劃分,其中每個8×8的模式可以繼續細劃分為兩個8×4,兩個4×8,四個4×4的塊,分別如圖2(e),(f)和(g)所示,在此所有的圖2(d)、(e)、(f)和(g)我們統稱為P8×8模式。對每個子塊都要進行運動估計,對每種模式(劃分方式)都要計算其成本函數的值,而具有最小成本函數值的模式即為最佳模式,所以對于劃分模式和參考圖像數相對較多的編碼標準來說,模式選擇是一個非常復雜和計算量很大的過程。
另外,在視頻壓縮標準(如H.264)中,為了簡化有全局運動或近似靜止區域的視頻的編碼,提出了復雜度相對較低的幀間模式,如空碼模式,這種模式采用的是16×16大小的宏塊,其最匹配塊所用的參考圖像為時間上最鄰接的圖像,運動矢量則是由當前宏塊的鄰近宏塊的運動矢量或參考圖像內對應位置宏塊的運動矢量經過某種計算后得到的。因此,對空碼模式,碼流中不需要消耗任何比特數來表示此宏塊的信息,如參考圖像、運動矢量、參差數據等。這種模式不需要運動估計,也不需要編碼運動信息,所以是一種相對簡單的編碼模式。H.264中P類型編碼圖像的SKIP模式和B類型編碼圖像的DIRECT16×16模式,以及MPEG4中的NOTCODED模式等都屬于空碼模式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710048114.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電動車輛驅動電機
- 下一篇:兩段轉子磁極鐵芯勵磁式直流電機





