[發(fā)明專利]表示經(jīng)編碼的比特流中的運動向量有效
| 申請?zhí)枺?/td> | 201910847304.4 | 申請日: | 2015-01-07 |
| 公開(公告)號: | CN110460861B | 公開(公告)日: | 2022-11-18 |
| 發(fā)明(設(shè)計)人: | S·西爾金;S·薩布林;Y·周;C-L·林;李明杰;G·J·沙利文 | 申請(專利權(quán))人: | 微軟技術(shù)許可有限責任公司 |
| 主分類號: | H04N19/52 | 分類號: | H04N19/52;H04N19/513;H04N19/523;H04N19/43;H04N19/70 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 賈麗萍 |
| 地址: | 美國華*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 表示 編碼 比特流 中的 運動 向量 | ||
一種用于在對運動圖像數(shù)據(jù)進行編碼時使用的格式,包括:包括多個幀的幀序列,其中幀中的至少一個區(qū)域是使用運動估計來編碼的;表示針對這些幀中的相應的每個幀或者這樣的幀中的每個幀內(nèi)的一個或多個區(qū)域中的相應的每個區(qū)域的運動估計的運動向量的運動向量值的相應的集合;以及與相應的幀或區(qū)域中的每個幀或區(qū)域相關(guān)聯(lián)的至少一個相應的指示符,其指示相應的幀或區(qū)域的相應的運動向量值是以第一分辨率來編碼的還是以第二分辨率來編碼的。
本申請是申請日為2015年1月7日、申請?zhí)枮?01580004117.X的發(fā)明專利申請“表示經(jīng)編碼的比特流中的運動向量”的分案申請。
背景技術(shù)
在現(xiàn)代通信系統(tǒng)中,可以通過諸如有線和/或無線網(wǎng)絡(luò)之類的(常常是基于分組的網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng)))的介質(zhì)而將視頻信號從一個終端發(fā)送至另一個終端。例如,視頻可以是通過在用戶終端(例如,臺式或膝上型計算機、平板計算機、或智能電話)上執(zhí)行的VoIP(互聯(lián)網(wǎng)協(xié)議語音)應用而進行的VoIP通話的一部分。
通常而言,視頻的幀由在發(fā)射終端處的編碼器進行編碼,以便對視頻的幀進行壓縮以用于通過網(wǎng)絡(luò)傳輸。針對給定幀的編碼可以包括幀內(nèi)編碼,通過幀內(nèi)編碼,將塊相對于同一幀中的其它塊而進行編碼。在該情況下,目標塊是根據(jù)該塊與相鄰的塊之間的差(殘差)來編碼的。可替代地,針對一些幀的編碼可以包括幀間編碼,通過幀間編碼,目標幀中的塊是通常基于運動預測而相對于前一幀中的對應的部分來編碼的。在該情況下,目標塊是根據(jù)運動向量而編碼的,所述運動向量標識了該塊與將從中預測該塊的塊的對應的部分之間的偏移,以及該塊與將從中預測該塊的塊的對應的部分之間的差(殘差)。在接收機處的對應的解碼器基于合適的類型的預測來對所接收到的視頻信號中的幀進行解碼,以便將其解壓以用于輸出至解碼器側(cè)的屏幕。
當對視頻進行編碼(壓縮)時,使用運動向量來生成針對當前的幀的幀間預測。編碼器首先針對與當前的塊(目標塊)最匹配的相似的塊(參考塊)而在先前經(jīng)編碼的幀中進行搜索,并且作為經(jīng)編碼的比特流的一部分而通過信號向解碼器發(fā)送參考塊與目標塊之間的位移。所述位移通常被表示為水平方向的x坐標和豎直方向的y坐標,并且被稱為運動向量。
參考“塊”實際上不限于在參考幀中的實際的塊位置處(即,不限于與目標塊相同的網(wǎng)格),而是,其是相對于目標塊的位置而偏移了運動向量的參考幀的對應大小的部分。根據(jù)本標準,以分數(shù)像素來表示運動向量。例如,在H.264標準中,以1/4像素分辨率來表示每個運動向量。因此作為示例,如果當前幀中的16×16的塊將根據(jù)先前一幀中的目標塊的位置的左邊1像素處的另一個16×16的塊來預測,則運動向量是(4,0)。或者,如果目標塊將根據(jù)目標塊的左邊例如僅僅3/4像素的參考塊來預測,則運動向量是(3,0)。分數(shù)向量位置處的參考塊本身實際上不存在,而相反,其是由參考幀的像素之間的插值而生成的。亞像素運動向量在壓縮效率方面可以獲得顯著的成效。
發(fā)明內(nèi)容
然而,相比于以整數(shù)像素分辨率來估計運動,使用分數(shù)像素分辨率招致更多比特對運動向量進行編碼,并且在針對最匹配的參考進行搜索時,使用分數(shù)像素分辨率還招致更多處理資源。針對視頻編碼而言,這可以是值得的,例如,這是由于降低的大小的更佳匹配的殘差通常可以比對運動向量進行編碼所招致的比特更加重要,或者所達到的質(zhì)量可以認為是正當利用了資源。然而,不是所有待編碼的運動圖像都是視頻(即,通過相機所捕獲的)。在本文中公認的是,當對從屏幕中所捕獲的圖像進行編碼(壓縮)而不是對通過相機所捕獲的運動圖像進行編碼(壓縮)時,經(jīng)編碼的比特流中的大多數(shù)運動向量通常將指向整數(shù)像素,而它們中極少部分被發(fā)現(xiàn)處于分數(shù)像素位置。因此,盡管編碼器一般以1/4像素的單位來表示比特流中的運動向量,但針對屏幕分享或記錄應用,通過以僅1像素的單位來對運動向量進行編碼,可以實際上節(jié)省帶寬而不過分損失質(zhì)量。
盡管如此,考慮到分數(shù)運動向量可以仍然對一般視頻(由相機所捕獲的)有用或可能對其它運動圖像(例如,動畫)有用,可以以如下的靈活的方式通過信號傳輸運動向量:當視頻源來自所捕獲的屏幕時,可以以1像素的單位通過信號傳輸運動向量,但是對于一般視頻和/或其它運動圖像,仍然可以使用分數(shù)像素。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于微軟技術(shù)許可有限責任公司,未經(jīng)微軟技術(shù)許可有限責任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910847304.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





