[發(fā)明專利]一種基于視頻內(nèi)容的局部區(qū)域精細(xì)編碼的通信系統(tǒng)無效

申請?zhí)枺?/td>	200810037647.6	申請日：	2008-05-20
公開（公告）號：	CN101588496A	公開（公告）日：	2009-11-25
發(fā)明（設(shè)計）人：	吳平	申請（專利權(quán)）人：	吳平
主分類號：	H04N7/26	分類號：	H04N7/26;G06K9/00
代理公司：	暫無信息	代理人：	暫無信息
地址：	200240上海***	國省代碼：	上海;31
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于視頻內(nèi)容局部區(qū)域精細(xì) 編碼通信系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

所屬技術(shù)領(lǐng)域

本發(fā)明涉及一種視頻通信系統(tǒng)，對于視頻圖像某局部區(qū)域，可由系統(tǒng)自動或者人工互動的方法進行定義并精細(xì)編碼。

背景技術(shù)

現(xiàn)在通用的視頻通信編碼方法例如國際標(biāo)準(zhǔn)MPEG4(ISO/IEC?14496-2)，H.264(ISO/IEC14496-10，ITU-T?Recommendation?H.264)，我國標(biāo)準(zhǔn)AVS(GB/T?20090)等等，都是以宏塊(Macro?Block)為單位，結(jié)合運動估計和補償，進行編碼。一個宏塊是由圖像中相鄰的NxM個點組成的數(shù)據(jù)塊，N和M的取值可以是4，8，16，32等。

實際應(yīng)用的通信帶寬是有限的，必須將編碼碼率控制在一定范圍內(nèi)。在編碼比特分配上，現(xiàn)有公知的做法，是對于運動估計誤差較大的宏塊，分配較多的比特，對于運動估計誤差較小的宏塊，分配較少的比特，從而在碼率允許范圍內(nèi)有效地保持圖像的清晰度。

可是這種分配方法沒有考慮宏塊的圖像內(nèi)容對于通信信息的影響。例如對于視頻通信的主要應(yīng)用視頻監(jiān)控和視頻通話，圖像中人臉區(qū)域是用戶十分關(guān)心的重要部分，希望在編碼碼率允許條件下盡量清晰。

相對于視頻(運動圖像序列)，靜止圖像編碼的JPEG2000(ISO?15444)技術(shù)，用小波變換技術(shù)，可以做到對某個用戶定義興趣區(qū)域(ROI，Region?Of?Interest)設(shè)置較高的編碼精細(xì)度。

可是小波變換主要針對靜止圖像，且運算量很大，目前還不適合應(yīng)用到運動圖像視頻實時通信系統(tǒng)當(dāng)中。

采用現(xiàn)有國際國內(nèi)標(biāo)準(zhǔn)方法的現(xiàn)有視頻通信系統(tǒng)尚無有效地對基于圖像內(nèi)容(而不是運動估計誤差大小)的區(qū)域進行局部精細(xì)編碼的。

發(fā)明內(nèi)容

為了克服現(xiàn)有的視頻通信系統(tǒng)沒有對基于圖像內(nèi)容的區(qū)域進行局部精細(xì)編碼的不足，本發(fā)明提供一種改進的視頻通信系統(tǒng)，可以自動或互動的定義基于圖像內(nèi)容的區(qū)域，并進行局部精細(xì)編碼，讓通信系統(tǒng)傳輸?shù)囊曨l內(nèi)容更加具有實用價值。

本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是：在視頻編碼部分增加重點區(qū)域描述參數(shù)，描述重點編碼區(qū)域。增加一個自動的圖像內(nèi)容特征檢測算法或裝置，檢測感興趣的內(nèi)容位于圖像的具體局部位置。在視頻解碼部分，增加一種交互方法，可由用戶定義一個或多個重點局部區(qū)域。系統(tǒng)將根據(jù)自動檢測的或者由用戶定義的重點區(qū)域信息設(shè)置參數(shù)。編碼器根據(jù)該參數(shù)，調(diào)整分配各個宏塊的編碼比特，達(dá)到對重點區(qū)域精細(xì)編碼的目的。

本發(fā)明的有益效果是，最終傳輸?shù)囊曨l當(dāng)中某些局部區(qū)域被重點精細(xì)編碼，從而使傳輸?shù)囊曨l圖像中該重點局部區(qū)域特別清晰，使通信系統(tǒng)的實用價值大大增加，例如使視頻監(jiān)控數(shù)字圖像中人臉區(qū)域相對更加清晰，更有利于刑偵破案和司法取證，或者更有利于人臉識別應(yīng)用，在帶寬十分受限的情況下價值更加明顯。

附圖說明

圖1是改進前編碼器結(jié)構(gòu)框圖，這是一個十分簡化的示意圖，是現(xiàn)在通用的視頻編碼標(biāo)準(zhǔn)的基本結(jié)構(gòu)。視頻變換一般是用DCT離散余弦變換。熵編碼一般是用Huffman哈夫曼編碼。量化一般是根據(jù)目標(biāo)誤差計算量化步長進行量化。

圖2是改進后編碼器結(jié)構(gòu)框圖，增加了對重點區(qū)域的檢測和設(shè)置，并對重點區(qū)域設(shè)置更高的量化精度要求進行精細(xì)量化編碼。圖中黑色方框中示意人臉區(qū)域。

具體實施方式

在視頻編碼部分增加重點區(qū)域描述參數(shù)R[N]，N＝0，R[0]＝[X01，Y01，X02，Y02]，X01，Y01是重點編碼區(qū)域的左上角點坐標(biāo)，X02，Y02是重點編碼區(qū)域的右下角點坐標(biāo)。增加一個自動的圖像內(nèi)容特征檢測算法或裝置，檢測圖像中是否出現(xiàn)特征內(nèi)容例如人臉和其具體位置[X01，Y01，X02，Y02]。在視頻解碼部分，增加一種交互方法，提供解碼圖象的觀看，并可以接收鼠標(biāo)消息，可由用戶用鼠標(biāo)在圖像上框定一個或多個重點區(qū)域R[N]，N＝1，2，3，...，R[n]＝[Xn1，Yn1，Xn2，Yn2]。系統(tǒng)將R[n]發(fā)送到編碼部分。編碼器根據(jù)自動檢測的和用戶定義的重點區(qū)域信息R[N]，在對每一個宏塊進行編碼的時候，先搜索判斷宏塊是否覆蓋重點區(qū)域R[N]，N＝0，1，2，...，如果是，則減小該宏塊編碼時候的目標(biāo)誤差值，減小量化步長，使用更多的比特進行編碼，減小編碼誤差，對該宏塊進行更加精細(xì)的編碼，從而對整個重點區(qū)域精細(xì)編碼。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吳平，未經(jīng)吳平許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/200810037647.6/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

H 電學(xué)

H04 電通信技術(shù)
H04N 圖像通信，如電視
H04N7-00 電視系統(tǒng)
H04N7-01 .制式的轉(zhuǎn)換
H04N7-015 .高清晰度電視系統(tǒng)
H04N7-025 .用于非圖像數(shù)據(jù)傳輸系統(tǒng)，例如在電視幀的有效部分的圖文傳輸
H04N7-04 .傳送單一電視信號的系統(tǒng)，即由單一載波傳送圖像和伴音
H04N7-06 .同時傳送單一電視信號的系統(tǒng)，即用一個以上載波傳送圖像和伴音

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】