[發(fā)明專利]用位深度可分級性的增強層殘差預測對視頻數(shù)據(jù)進行編碼和/或解碼的方法和設備有效
| 申請?zhí)枺?/td> | 200780053544.2 | 申請日: | 2007-06-27 |
| 公開(公告)號: | CN101796841A | 公開(公告)日: | 2010-08-04 |
| 發(fā)明(設計)人: | 高永英;武宇文;王傳銘 | 申請(專利權)人: | 湯姆遜許可公司 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26 |
| 代理公司: | 北京康信知識產(chǎn)權代理有限責任公司 11240 | 代理人: | 余剛;吳孟秋 |
| 地址: | 法國*** | 國省代碼: | 法國;FR |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 分級 增強 層殘差 預測 視頻 數(shù)據(jù) 進行 編碼 解碼 方法 設備 | ||
技術領域
本發(fā)明涉及數(shù)字視頻編碼的技術領域。其為新型可分級性 (scalability)——位深度可分級性提供編碼(coding)解決方案。
背景技術
近年來,在諸如科學成像、數(shù)字影院、可放映高質(zhì)量視頻的計算機游戲 以及專業(yè)工作室和家庭影院的相關應用的許多領域,越來越需要較高的位色 彩深度,而非傳統(tǒng)的八位色彩深度。因此,現(xiàn)有技術的視頻編碼標準H.264/AVC 已經(jīng)包括保真度范圍擴展(Fidelity?Range?Extensions,F(xiàn)RExt),其支持可 達14位的樣本和可達4:4:4的色度采樣(chroma?sampling)。當前的SVC 基準軟件JSVM不支持高位深度。
然而,現(xiàn)有的高級編碼解決方案均不支持位深度可分級性。對于具有兩 個不同解碼器的情景,或?qū)ξ簧疃染哂胁煌蟮目蛻?,例如對同一原始? 頻(raw?video)要求8位和12位位深度,現(xiàn)有的H.264/AVC解決方案將對 12位的原始視頻進行編碼以產(chǎn)生第一比特流,然后將12位的原始視頻轉(zhuǎn)換 為8位的原始視頻并對其進行編碼以產(chǎn)生第二比特流。如果將視頻傳送到要 求不同位深度的不同客戶,則必須傳送兩次,或者將2個比特流一起放入一 張磁盤。壓縮率和運算復雜度兩者的效率都很低。
歐洲專利申請EP06291041公開了一種可分級解決方案,該方案一次對整 個12位原始視頻進行編碼從而生成一個比特流,該比特流包含H.264/AVC兼 容的基本層(BL)和可分級的增強層(EL)。與另外的第二比特流相比,上述 第一比特流上的全部可分級比特流的開銷小。如果H.264/AVC解碼器在接收 端可用,則僅對BL子比特流(sub-bitstream)解碼,且經(jīng)解碼的8位視頻 可在傳統(tǒng)的8位顯示裝置上觀看;如果位深度可分級解碼器在接收端可用, 則BL子比特流和EL子比特流都可以被解碼,從而獲得12位視頻,且其可在 支持8位以上的色彩深度的高質(zhì)量顯示裝置上觀看。
發(fā)明內(nèi)容
H.264/AVC可分級性擴展SVC還提供其他類型的可分級性,如空間可分 級性。在空間可分級性中,BL和EL中像素的數(shù)目是不同的。因此,出現(xiàn)了 如何將位深度可分級性與其他可分級性相結(jié)合尤其是與空間可分級性結(jié)合的 問題。本發(fā)明提供該問題的解決方案。
權利要求1公開了一種編碼方法,該方法允許位深度可分級性與其他可 分級性相結(jié)合。權利要求5公開了相應的解碼方法。
利用編碼方法的設備在權利要求9中公開,利用解碼方法的設備在權利 要求10中公開。
根據(jù)本發(fā)明,在層間預測中使用基于逆色調(diào)映射技術(inverse?tone? mapping)的查詢表(LUT)以提高編碼效率。當BL片的類型是I片(I-slice) 時使用基于逆色調(diào)映射技術的LUT?;谠诰幋a器所重構的BL?I片和所配置 的原始EL片來創(chuàng)建LUT,整個方案可以在SVC的結(jié)構中實施,并且支持對其 他類型的可分級性、時間、空間以及SNR可分級性的兼容性。
在一個實施例中,在兩個邏輯步驟中對BL信息增采樣,一個邏輯步驟是 紋理增采樣,另一個邏輯步驟是深度增采樣。紋理增采樣是增加像素數(shù)目的 過程,深度增采樣是增加每個像素可以具有的值的數(shù)目的過程。該值對應于 像素的色彩強度。增采樣的BL單元被用來預測所配置(collocated)的EL 單元,編碼器由EL視頻數(shù)據(jù)產(chǎn)生殘差,并且該殘差可以進一步被編碼(通常 被熵編碼)和傳送。將被增采樣的BL信息可以是任何粒度,例如單像素單元、 像素塊、宏塊(MBs)或者整個圖像。此外,可以在單個步驟中執(zhí)行兩個邏輯 增采樣步驟。在編碼器側(cè)增采樣基本層信息,在解碼器側(cè)也以同樣的方式增 采樣基本層信息,其中,增采樣涉及空間和位深度的特征。
而且,可以為幀內(nèi)編碼的圖像和幀間編碼的圖像執(zhí)行所組合的空間和位 深度增采樣。
具體地,用于對具有基本層和增強層的視頻數(shù)據(jù)進行編碼的方法,其中, 基本層的像素具有比增強層的像素低的位深度和空間分辨率(resolution), 該方法包括以下步驟:
以片為層級對基本層數(shù)據(jù)進行編碼,其中,第一基本層片被幀內(nèi)編碼, 第二基本層片被幀間編碼,
重構經(jīng)編碼的基本層片,
對所重構的基本層片進行增采樣,其中,獲得相應增強層片的第一預測 形式(version),其具有比基本層片高的空間、時間或SNR分辨率,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湯姆遜許可公司,未經(jīng)湯姆遜許可公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200780053544.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種檳榔油的制取方法
- 下一篇:半導體激光元件以及半導體激光元件制造方法
- 編碼裝置、解碼裝置、編碼方法及解碼方法
- 用于分層圖像編碼和解碼的方法和設備
- 基于深度殘差網(wǎng)絡的水下通信調(diào)制方式識別方法及系統(tǒng)
- 一種用于水下通信調(diào)制識別的深度殘差網(wǎng)絡及系統(tǒng)
- 黑毛豬肉圖像的識別方法
- 膠囊殘差神經(jīng)網(wǎng)絡、膠囊殘差神經(jīng)網(wǎng)絡的圖像分類方法
- 一種圖像分層編碼方法
- 一種基于殘差網(wǎng)絡的特征圖處理方法
- 計算機實現(xiàn)的方法、計算機實現(xiàn)的診斷方法、圖像分類設備、以及計算機程序產(chǎn)品
- 一種基于深度改進殘差網(wǎng)絡的SAR圖像分類方法





