[發(fā)明專利]采用成本估計的編碼器分片大小控制有效
| 申請?zhí)枺?/td> | 201580069058.4 | 申請日: | 2015-01-16 |
| 公開(公告)號: | CN107005699B | 公開(公告)日: | 2021-03-12 |
| 發(fā)明(設(shè)計)人: | O.戈利克瓦;P.弗羅洛夫;A.法德夫 | 申請(專利權(quán))人: | 英特爾公司 |
| 主分類號: | H04N19/15 | 分類號: | H04N19/15;H04N19/132;H04N19/174 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 葉培勇;劉春元 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 采用 成本 估計 編碼器 分片 大小 控制 | ||
背景技術(shù)
這涉及包括視頻會議的通過網(wǎng)絡(luò)的視頻分發(fā)。視頻傳輸使用相等大小的數(shù)據(jù)分組,每個分組包含完整視頻可解碼單元。現(xiàn)代壓縮格式的最小可解碼單元是分片(slice)。分片是幀的空間不同區(qū)域,其與同一幀的任何其他區(qū)域被分開編碼。但是硬件編碼器通常由于性能原因而以幀的粒度進行操作。
如果硬件編碼器沒有被設(shè)計成支持分片大小限制,則不可能將幀分解為分片,因為分片中的宏塊(MB)分布對幀提前被預(yù)定義。沒有分片大小控制(當硬件編碼器對于軟件用戶是黑盒時),一些壓縮視頻分片可超過分片大小界限。
編碼分片大小必須不超過所定義水平,但是將幀分裂成分片降低編碼效率,并且對相同視覺質(zhì)量要求更高位率。這個視覺質(zhì)量可通過對具有不同分片分割的幀迭代地進行重新編碼直到達到所需分層大小來取得。
附圖說明
針對下列附圖來描述一些實施例:
圖1是一個實施例的框圖;
圖2是一個實施例的流程圖;
圖3是一個實施例的系統(tǒng)繪圖;以及
圖4是一個實施例的前視圖。
具體實施方式
參照圖1,繪出按照H.264/AVC標準的示范編碼算法。參見從ITU電信標準化部門(ITU-T)可得到的ISO/IEC國際標準14496-10(MPEG-4部分10 2/14)高級視頻譯碼(Advanced Video Coding)。輸入視頻幀100被分割為塊102。每個塊使用相鄰重構(gòu)像素經(jīng)歷幀內(nèi)預(yù)測104。來自幀內(nèi)預(yù)測的預(yù)測殘余經(jīng)歷變換106,以便對數(shù)據(jù)進行解相關(guān)。上下文自適應(yīng)變長譯碼(CAVLC)可被采用以對掃描變換系數(shù)進行熵編碼108。備選地,可通過上下文自適應(yīng)二進制算術(shù)譯碼(CABAC)對變換系數(shù)進行譯碼。要減輕塊效應(yīng),自適應(yīng)環(huán)內(nèi)去塊濾波器110可應(yīng)用于來自反饋回路的重構(gòu)。視頻運動估計單元112確定圖片100中的移動對象的運動向量的位置。運動數(shù)據(jù)則由運動補償階段114來使用。頻率變換塊106將宏塊變換到空間頻域中。然后量化頻域數(shù)據(jù)。量化考慮當前宏塊的數(shù)據(jù)值的范圍。逆頻率變換塊116把來自逆量化階段的頻域數(shù)據(jù)變換回空間域。量化數(shù)據(jù)由熵譯碼塊108來編碼,熵譯碼塊108采用更少位對更頻繁使用的符號進行編碼以及采用更多位對不太頻繁使用的符號進行編碼。
圖形處理器的視頻運動估計(VME)單元在幀編碼之前執(zhí)行快速預(yù)處理,以便基于宏塊的權(quán)重在分片之中分布宏塊。預(yù)處理階段的結(jié)果基于編碼階段迭代地被改進。在一些實施例中,這允許具有最小視頻質(zhì)量降低的實時分片大小限制的編碼。能夠采用給予宏塊權(quán)重(例如實際編碼之后的宏塊大小)的軟件或硬件編碼步驟來替代硬件預(yù)處理。
應(yīng)用估計最大迭代次數(shù),以保證實時編碼。例如,如果對一幀進行編碼花費4 ms,并且具有解碼的一幀成本估計(或VME)花費少于2 ms,則不超過7次重新譯碼迭代能夠被使用并且仍然取得實時編碼。
應(yīng)用能夠使用如圖2所示的階段對幀重新譯碼,直到所有編碼幀大小都小于所定義水平。
應(yīng)用使用至少3個階段:“試運行”、“重新譯碼0”和“跳幀”,以提供分片大小限制。增加階段數(shù)量能夠改進質(zhì)量,但是降低性能。
應(yīng)用能夠具有多于六個階段。在那種情況下,一些階段能夠重復(fù)。例如:“試運行”、“重新譯碼0”、“重新譯碼1”、“強制模式0”、“強制模式0”、“跳幀”。
參照圖2,基于宏塊統(tǒng)計來估計分片大小的預(yù)處理10能夠采用硬件(VME)單元、硬件PAK單元或者通過軟件編碼(只列舉三個示例)來實現(xiàn)。宏塊統(tǒng)計可包括宏塊復(fù)雜度量度或者在幀上的成本分布加上來自先前編碼幀的相同數(shù)據(jù)。可使用成本函數(shù)(例如絕對差之和(SAD)、平方差之和(SSD)、率失真(RD)成本、絕對變換差之和(SATD)、哈爾成本函數(shù)(用于VME中)或者編碼宏塊大小)來估計宏塊復(fù)雜度。
作為備選方案,能夠?qū)M行編碼和解碼。譯碼宏塊長度能夠被用作宏塊成本。
預(yù)處理將具有所需譯碼參數(shù)的原始和參考幀看作是對相等大小分片的輸入和輸出估計宏塊指配。參數(shù)可以是編碼器初始化參數(shù),例如位率、幀率或者圖片組結(jié)構(gòu),只列舉幾個示例。幀中的分片數(shù)量(numSlices)從先前幀統(tǒng)計(例如來自前一幀的宏塊大小和宏塊成本)來預(yù)測。例如,分片的初始數(shù)量可設(shè)置為與前一幀中相同。在一個實施例中,在將實時編碼用于預(yù)處理時:
1) 采用各分片中的相等數(shù)量的宏塊對幀進行編碼。
2)通過使用解碼器來計算分片大小和宏塊大小。
在將VME單元調(diào)用用于預(yù)處理階段時:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于英特爾公司,未經(jīng)英特爾公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201580069058.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





