[發(fā)明專利]基于運動目標檢測的視頻編碼方法有效

申請?zhí)枺?/td>	200810062879.7	申請日：	2008-07-08
公開（公告）號：	CN101321287A	公開（公告）日：	2008-12-10
發(fā)明（設計）人：	唐慧明;楊名;鮑慶潔;盧超;虞露;劉云海	申請（專利權）人：	浙江大學
主分類號：	H04N7/26	分類號：	H04N7/26;H04N7/50;G06T7/20
代理公司：	暫無信息	代理人：	暫無信息
地址：	310027浙江省杭州***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于運動目標檢測視頻編碼方法
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明屬于數(shù)字視頻編碼和數(shù)字視頻分析領域，特別涉及一種利用視頻檢測結果提高視頻編碼性能的方法。?

背景技術

視頻監(jiān)控是安全防范行業(yè)中的一個重要組成部分。隨著視頻監(jiān)控系統(tǒng)規(guī)模的擴大，監(jiān)視場點的不斷增多，長時間監(jiān)控累積的數(shù)據(jù)是十分龐大的，存放和檢索數(shù)據(jù)需要付出極大的成本，因此必須對視頻信息進行高效壓縮，有效利用網(wǎng)絡資源，降低數(shù)據(jù)存儲設備的存儲量和復雜度。?

對大規(guī)模視頻監(jiān)控系統(tǒng)來說，由于人力、場地和設備等資源有限，不可能對所有視頻進行在線監(jiān)視，需要采用運動目標視頻檢測和報警等技術輔助人工監(jiān)視，及時發(fā)出報警信號，并記錄視頻事件。視頻編碼技術的發(fā)展使壓縮性能有了很大的提高，且大多數(shù)是基于塊的預測和變換混合的編碼技術，如H.264/AVC、MPEG4、AVS。考慮到視頻監(jiān)控通常有較多靜止區(qū)域等特點，可利用視頻檢測得到的靜止區(qū)和運動區(qū)，提高靜止區(qū)的編碼效率，降低碼率而不影響運動目標的清晰度。但以MPEG-4為代表的基于視頻對象的壓縮編碼技術由于其對目標的提取必須準確，一般不能用于實時視頻編碼。MPEG-4在用于視頻監(jiān)控或?qū)崟r通信時，一般不作目標分割，只將整幅圖像作為一個視頻對象。H.264和AVS等視頻編碼標準引入了一些更細致的編碼方法，提高了壓縮比，但其基本框架仍是基于塊的預測和變換混合的編碼。利用不變的背景圖像作為參考圖像能提高視頻編碼效率，但現(xiàn)有的提取真實背景的方法并不能利用解碼重建圖像生成，背景圖像圖像需要單獨傳輸。?

H.264或AVS等新的視頻編碼技術提供了很好的壓縮性能。但是在智能監(jiān)控系統(tǒng)，以及視頻會議、可視電話中，在靜止區(qū)域，每幀并不能提供更多的有用信息，且由于受噪聲，或是環(huán)境細微變化影響形成的碼流數(shù)據(jù)占了視頻碼流的很大一部分。因此，如果能對其進行處理，或采用更有效的視頻編碼方法，既能不降低重要區(qū)域的圖像質(zhì)量，又能減少壓縮后的碼流數(shù)據(jù)，則能更好地滿足應用需要。?

發(fā)明內(nèi)容

本發(fā)明的目的是針對智能化視頻監(jiān)控應用，提出了一種在混合編碼框架中添加運動目標檢測單元的方法，該方法區(qū)別對待靜止圖像區(qū)域和運動圖像區(qū)域，通過改變靜止區(qū)域的編碼策略，并進行視頻處理，從而減少靜止區(qū)域的碼流，在不降低運動區(qū)域圖像質(zhì)量的條件下，可降低整幅圖像壓縮后的碼流，提高視頻傳輸、存儲的效率。本發(fā)明特別適合在視頻監(jiān)控、可視電話和視頻會議等場合的應用。

本發(fā)明主要提出了針對視頻編碼的改進方案。其中所述的視頻處理包括引入基于視頻的運動目標檢測單元，根據(jù)檢測結果將圖像分為運動區(qū)和靜止區(qū)，并對靜止區(qū)圖像采用以下三種方法中的一種或一種以上的方法進行編碼處理：對由運動目標檢測單元確定的靜止區(qū)域進行幀間濾波；對靜止區(qū)域調(diào)整預測編碼模式策略，增加靜止區(qū)域宏塊選擇SKIP模式(即作為SKIP宏塊，不對殘差數(shù)據(jù)進行編碼)的概率；創(chuàng)建并維護一個背景圖像作為附加的參考圖像。采用上述一種或一種以上的方法進行編碼處理的本質(zhì)都是通過提高靜止區(qū)壓縮效率來提高編碼的效率，該方法實質(zhì)上是以靜止區(qū)域圖像質(zhì)量的較小下降換取編碼效率的大幅度提高，這是對原有的基于預測和變換編碼技術的改進。?

本發(fā)明提出的區(qū)分靜止區(qū)域和運動區(qū)域與MPEG-4中基于對象編碼的不同之處在于，本發(fā)明并不要求對運動物體有完整、準確無誤的分割，編碼仍然以塊為單位，所以并不會因運動區(qū)域提取不準確而導致的視頻編碼內(nèi)容的錯誤。?

本發(fā)明提出的基于運動目標檢測的視頻編碼方法中靜止宏塊的模式選擇策略，適用于MPEG-4、H.264/AVC、AVS、H.263、MPEG-2等基于幀間預測和變換編碼技術的編碼。本發(fā)明提出的方法需要一個運動目標檢測單元，用于確定運動區(qū)域和靜止區(qū)域。?

運動目標檢測單元是以像素為單位的，在混合編碼框架中是以塊為單位的。如果宏塊中包含運動區(qū)域像素，則認為該宏塊是運動宏塊，否則為靜止宏塊。對于運動宏塊，本系統(tǒng)采用原有的模式選擇方式對其進行編碼。對于靜止宏塊，如果當前幀是I幀，則按原有的編碼模式進行幀內(nèi)編碼，如果當前幀是P幀或B幀，則使用新的模式?jīng)Q策。?

在新的模式?jīng)Q策中，計算當前宏塊SKIP模式的率失真，第一種方法是如果該率失真小于某個閾值，就直接選擇SKIP模式；第二種方法是將該SKIP模式率失真值乘以一個縮小因子或者減去一個縮小因子，從而減小靜止宏塊的SKIP模式的率失真，增加靜止宏塊選擇SKIP模式的概率。?

下載完整專利技術內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于浙江大學，未經(jīng)浙江大學許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200810062879.7/2.html，轉載請聲明來源鉆瓜專利網(wǎng)。