[發明專利]確定變換塊尺寸的方法和設備有效
| 申請號: | 201210019911.X | 申請日: | 2012-01-21 |
| 公開(公告)號: | CN102857755A | 公開(公告)日: | 2013-01-02 |
| 發明(設計)人: | 袁媛;鄭蕭楨;何蕓 | 申請(專利權)人: | 華為技術有限公司;清華大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/50 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 變換 尺寸 方法 設備 | ||
技術領域
本發明涉及通信技術領域,特別涉及確定變換塊尺寸的方法和設備。?
背景技術
為了盡量減少傳送視頻數據所需要的帶寬,可以采用多種視頻壓縮方法對視頻數據進行壓縮,其中視頻壓縮方法包括:幀內壓縮和幀間壓縮。現在多采用基于運動估計的幀間壓縮方法。具體的,圖像的編碼端采用幀間壓縮方法對圖像壓縮并編碼的過程包括:編碼端將待編碼圖像塊劃分成若干個大小相等的子圖像塊,然后針對每個子圖像塊,在參考圖像中搜索與當前子圖像塊最匹配的圖像塊作為預測塊,然后將該子圖像塊與預測塊的相應像素值相減得到殘差,并將該殘差經變換與量化后得到的值進行熵編碼,最后將熵編碼得到的比特流和運動矢量信息一并發給解碼端,其中,運動矢量信息表示當前子圖像塊與預測塊的位置差。在圖像的解碼端,首先獲得熵編碼比特流后進行熵解碼,得到相應的殘差,以及相應的運動矢量信息;然后根據運動矢量信息在參考圖像中獲得相應的匹配圖像塊(即上述預測塊),再根據匹配圖像塊中各像素點的值和殘差值中對應像素點的值相加得到當前子圖像塊中各像素點的值。幀內預測是指利用本幅圖像內的信息對圖像塊進行預測得到預測塊,編碼端根據預測模式、預測方向、圖像塊周圍的像素值得到預測塊對應的像素,將圖像塊像素與預測塊像素相減得到殘差,殘差經變換、量化和熵編碼后寫入碼流中;解碼端解析碼流,對碼流進行熵解碼、反量化、反變換后得到殘差塊,解碼端根據預測模式、預測方向、圖像塊周圍的像素值得到預測塊,將殘差塊像素與預測塊像素相加得到重構圖像塊。?
在現在的視頻編解碼標準中存在編碼單元(coding?unit)、預測單元(prediction?unit)和變換單元(transform?unit)的概念。其中,編碼單元是在編碼端或解碼端進行編碼或解碼時操作的圖像塊。預測單元是編碼單元中具有獨立預測模式的圖像塊。預測塊是編碼單元進行預測操作的圖像塊,一個預測單元中可能包含多個預測塊。變換單元是編碼單元中進行變換操作的?圖像塊,此時的圖像塊也可稱為變換塊。考慮到預測塊內部差值信號的相關性較強,而大塊變換比小塊變換能量集中性能更高。更廣義的,一個圖像塊可包含一個或多個預測塊,在編解碼端以預測塊為單位進行預測;同時,一個圖像塊包含一個或多個變換塊,在編解碼端以變換塊為單位進行變換。?
在現有的視頻編解碼標準中,如移動圖像專家組(Moving?Picture?Experts?Group,MPEG),H.264/AVC(Advanced?Video?Coding,增強視頻編碼),一個圖像塊,或稱為宏塊(macroblock)、超宏塊(super-macroblock)等,被劃分為若干子圖像塊,這些子圖像塊的尺寸可為64×64、64×32、32×64、32×32、32×16、16×32、16×16、16×8、8×16、8×8、8×4、4×8、4×4等,子圖像塊以這些尺寸進行上述的運動估計和運動補償,圖像的編碼端需要將標識圖像塊劃分方式的碼字發送給圖像的解碼端,以便圖像的解碼端獲知圖像編碼端的劃分方式,并根據該劃分方式和運動矢量信息,確定相應的預測塊。在現有的視頻編解碼標準中這些子圖像塊均為N×M(N和M均為大于0的整數)的矩形塊,并且N和M具有倍數關系。?
在現有的視頻編碼和解碼技術中,可以使用變換矩陣去除圖像塊的殘差的相關性,即去除圖像塊的冗余信息,以便提高編碼效率,圖像塊中的數據塊的變換通常采用二維變換,即在編碼端將數據塊的殘差信息分別與一個N×M的變換矩陣及其轉置矩陣相乘,相乘之后得到的是變換系數。上述步驟可以使用以下公式描述:?
f=T′×C×T?
其中,C代表數據塊的殘差信息,T和T′代表變換矩陣和變換矩陣的轉置矩陣,f代表數據塊的殘差信息經變換后得到的變換系數矩陣。其中,變換矩陣可以是離散余弦變換(Discrete?Cosine?Transform,DCT)矩陣,整數變換(Integer?Transform)矩陣、KL變換(Karhunen?Lòeve?Transform,KLT)矩陣等。其中,KLT可以更好的考慮圖像塊或圖像塊殘差的紋理信息,因此使用KLT可以達到較好的效果。?
對圖像塊的殘差信息進行上述處理相當于將圖像塊的殘差信息從空域轉換至頻域,且經處理后得到的變換系數矩陣f集中于低頻區域;編碼端對圖像塊的殘差信息進行上述變換之后,對變換后得到的變換系數矩陣再進行量化、熵編碼等處理后,將熵編碼得到的比特流發送給解碼端。為了使解碼端知道編碼端所采用的變換矩陣類型和尺寸,通常,編碼端會將表示當前圖像?塊所使用的變換矩陣的指示信息發送給解碼端。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司;清華大學,未經華為技術有限公司;清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210019911.X/2.html,轉載請聲明來源鉆瓜專利網。





