[發明專利]基于宏塊特征的快速運動估計視頻編碼方法無效
| 申請號: | 201010140709.3 | 申請日: | 2010-04-02 |
| 公開(公告)號: | CN101815218A | 公開(公告)日: | 2010-08-25 |
| 發明(設計)人: | 劉鵬宇;賈克斌 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/32 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 快速 運動 估計 視頻 編碼 方法 | ||
1.基于宏塊特征的快速運動估計視頻編碼方法,根據當前預測宏塊的特征和幀間預測編 碼模式設計運動估計搜索模板和動態的快速搜索方法,依據當前被預測宏塊的運動劇烈程度, 結合幀間預測編碼模式的選擇結果,動態的調整搜索范圍和自適應的選擇相應的運動估計搜 索準則,從而實現對幀間宏塊的快速運動估計預測編碼,其特征在于具體包括下述步驟:
步驟1:提取當前被預測宏塊的亮度分量值:以當前被預測宏塊的亮度信息為編碼對象, 從當前視頻幀中提取被預測宏塊的亮度分量信息;
步驟2:確定運動估計搜索模板,分配搜索點:包含四層搜索,隨著搜索半徑的增加, 搜索范圍的擴大,使每層的搜索點數逐步遞增由內到外,每層上的搜索點數依次為8,8,12, 16;
步驟3:確定高準確率的初始搜索點:采用拉格朗日率失真優化函數,作為運動估計判 決依據,選擇率失真意義上最佳的匹配預測塊和最優運動矢量,使得運動矢量和殘差編碼的 比特分配最小;利用拉格朗日率失真準則選擇最優運動矢量問題可描述為:
Jmotion(mv,ref|λmotin)=SAD[s,r(ref,mv)]+λmotin[R(mv-pred)+R(ref)]??(1)
(1)式中Jmotion為當前預測的運動矢量的率失真代價值RDcostmotion;s為當前宏塊像素 值;mv是當前矢量,pred為預測矢量;ref為選擇的參考幀;r(ref,mv)為參考宏塊的像素值; R是運動矢量進行差分編碼消耗的比特數,包括運動矢量與其預測值的差值的編碼比特數和 參考幀的編碼比特數;λmotion為拉格朗日乘子;SAD為當前塊與參考塊像素之間的絕對誤差和;
公式(2)中B1和B2分別表示塊的水平像素數和垂直像素數,根據不同的幀間預測模式, 其取值可為16,8,4;s(x,y)為當前宏塊像素值;r(x,y)為參考宏塊的像素值,mx和my分別 表示水平和垂直方向的位移量;
利用拉格朗日率失真準則選擇最優模式的問題可表述為:
Jmode(s,c,MODE|λmode)=SSD(s,c,MODE|QP)+λmode×R(s,c,MODE|QP)??(3)
公式(3)中,MODE表示當前宏塊的一種幀間編碼模式;Jmode(s,c,MODE|λmode)表示 MODE模式下的率失真代價值RDcostmode;s為原始的視頻信號;c為采用MODE模式編碼后 的重構視頻信號;λmode為拉格朗日乘子;R(s,c,MODE|QP)是與模式和量化參數有關的包括 宏塊頭信息、運動矢量和所有DCT塊信息的總的二進制位數,它是通過對塊進行實際的編碼 后獲得的,所以其運算量較大;QP是編碼量化步長;SSD(s,c,MODE)為原始信號與重構信 號之間的平方差值和,即:
公式(4)式中:B1和B2分別表示塊的水平像素數和垂直像素數,其取值可為16,8,4; SY[x,y]表示源宏塊亮度信息的取值,CY[x,y,MODE|QP]表示重建宏塊的亮度信息的取值;SU, SV和CU,CV分別表示相應的色差信息的取值;具體包括以下步驟:
步驟3.1:利用三種預測編碼模式選取最佳的運動矢量Motion?Vector,MV,即基于空間域 的中值預測MVpred_space;基于H.264標準采用的運動估計多尺寸宏塊劃分特點的上層預測 MVpred_uplayer;基于時間域的參考幀運動矢量預測MVpred_ref;
(a)MVpred_space:中值預測,利用空間相關性,取已求出的當前幀的左、上、右上臨塊 的運動矢量的中間值;
(b)MVpred_uplayer:上層預測,利用H.264運動估計多尺寸宏塊劃分特點,包含模式1:
16×16,模式2:16×8,模式3:8×16,模式4:8×8,模式5:8×4,模式6:4×8,模 式7:4×4的分級搜索順序,取已求出的同位置、上一級up?layer、大一倍塊的運動矢量;
(c)MVpred_ref:時間域預測,利用時間相關性,根據已求出的前一幀參考幀中的當前塊 的運動矢量MVref按比例進行預測其中當前宏塊所在幀的時間為 t,預測宏塊所在參考幀的時間為t’;
步驟3.2:相應的SAD值與預測的運動矢量MV具有很強的相關性;將MVpred_space, MVpred_uplayer,MVpred_ref所指向點的率失真代價值分別記為pred_space_mincost, pred_uplayer_mincost,pred_ref_mincost,將具有最小率失真代價值的運動矢量指向點作為初 始搜索點,該點將作為下一步非對稱十字形搜索的初始搜索中心點;
步驟4:非對稱十字形搜索:非對稱十字搜索水平搜索范圍設為W,垂直搜索范圍為水 平搜索范圍的一半,即為W/2,相鄰搜索點之間間距取兩個像素單位,則水平方向的搜索點 數為W/2;垂直方向的搜索點數為W/4;在非對稱十字形搜索中共有W/2+W/4=3W/4個候 選搜索點;本步驟在這3W/4個候選搜索點中確定的最佳匹配點作為下一步非均勻多層六邊 形格網格搜索的初始搜索中心點;
步驟5:判斷當前宏塊運動劇烈程度:將當前預測宏塊按劇烈程度分為三個檔次,即運 動劇烈程度較低、運動劇烈程度中等、運動劇烈程度較高;當前預測宏塊運動劇烈程度的判 斷方法如下:
步驟5.1:根據公式(1)計算當前預測宏塊的運動矢量的率失真代價值記為RDcostmotion, 根據公式(3)計算當前預測宏塊在mode模式下的率失真代值記為RDcostmode,從中選取具 有最小預測的率失真代價值,記為RD_mincost,即:RD_mincost=min{Pred_space_mincost, Pred_uplayer_mincost,Pred_ref?mincost};
步驟5.2:依據初始搜索點選擇的運動矢量預測方式確定pred_mincost的值:
如果在步驟3中確定的初始搜索點采用時間域預測方式的運動矢量,則 pred_mincost=pred_ref_mincost;
如果在步驟3中確定的初始搜索點沒有采用時間預測方式的運動矢量,再分為兩類情況:
若當前運動估計預測宏塊的幀間編碼模式選擇的是16×16大尺寸模式,則 pred_mincost=pred_space_mincost;
若當前運動估計預測宏塊的幀間編碼模式選擇的不是16×16大尺寸模式,則 pred_mincost=pred_uplayer_mincost;
步驟5.3:計算運動劇烈程度調整因子γ,δ:
公式(5)中Bsize[blocktype]表示當前預測宏塊的大小,其取值可為16,8,4;
矩陣αRadii1[blocktype]依據7種幀間宏塊劃分模式,其取值定義為:
αRadii1[1]=-0.23;αRadii1[2]=-0.23;αRadii1[3]=-0.23;
αRadii1[4]=-0.25;αRadii1[5]=-0.27;αRadii1[6]=-0.27;αRadii1[7]=-0.28;
矩陣αRadii2[blocktype]依據7種幀間宏塊劃分模式,的取值定義為:
αRadii2[1]=-2.39;αRadii2[2]=-2.40;αRadii2[3]=-2.40;
αRadii2[4]=-2.41;αRadii2[5]=-2.45;αRadii2[6]=-2.45;αRadii2[7]=-2.48;
步驟5.4:當前預測宏塊運動劇烈程度的判斷:
當RD_mincost<(1+γ)×pred_mincost時,判定當前預測宏塊的運動劇烈程度較低;
當(1+γ)×pred_mincost<RD_mincost<(1+δ)×pred_mincost時,判定當前預測宏塊的運動 劇烈程度中等;
當RD_mincost>(1+δ)×pred_mincost時,判定當前預測宏塊的運動劇烈程度較高;
步驟6:進行5×5像素全搜索:在步驟5已經判斷出當前搜索內容劇烈程度之后,只在 搜索內容劇烈程度較低時才以當前預測點為中心,在其周圍的4×4區域進行5×5個搜索點 數的全搜索;當運動劇烈程度為中等或者較劇烈時則放棄5×5全搜索,直接進入步驟7;
步驟7:非均勻多層六邊形網格搜索:依據當前宏塊的運動劇烈程度動態選擇運動估計 搜索層數:采用非均勻六邊形搜索作為基本搜索模式,搜索層數最多為4層;運動劇烈程度 較低時,只進行2層非均勻六邊形網格搜索,每層的搜索點數為8;運動劇烈程度中等時, 進行3層非均勻六邊形網格搜索,由內到外的搜索點數依次為8,8,12;運動劇烈程度為較 高時,才進行4層非均勻六邊形網格搜索,由內到外的搜索點數依次為8,8,12,16;本步 驟在非均勻六邊形網格搜索中確定的最佳匹配點作為步驟8擴展對稱六邊形搜索的初始搜索 中心點;
步驟8:擴展對稱六邊形搜索:以步驟7確定的最佳匹配點作為本步驟的初始搜索中心 點;這里采用兩個階段搜索方式:
第一階段:先以步長為2個像素進行對稱六邊形六點搜索,比較中心點和6個對角點的 率失真代價值,依據率失真準則以率失真代價值最小點作為下一次搜索的中心點,直到中心 點的率失真代價值變為最小點;
第二階段:再減小步長,以步長為1個像素進行菱形四點搜索,重復第一階段的搜索過 程,依據率失真準則直到中心點的率失真代價值為最小點時終止搜索,該點即為最終確定的 整像素搜索最佳匹配點;
步驟9:輸出運動估計編碼信息到Out.264文件中,并且記錄運動估計時間、碼率、峰值 信噪比信息,以評價編碼算法質量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010140709.3/1.html,轉載請聲明來源鉆瓜專利網。





