[發(fā)明專利]一種基于視頻內(nèi)容的局部區(qū)域精細(xì)編碼的通信系統(tǒng)無效
| 申請?zhí)枺?/td> | 200810037647.6 | 申請日: | 2008-05-20 |
| 公開(公告)號: | CN101588496A | 公開(公告)日: | 2009-11-25 |
| 發(fā)明(設(shè)計)人: | 吳平 | 申請(專利權(quán))人: | 吳平 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;G06K9/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200240上海*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 視頻 內(nèi)容 局部 區(qū)域 精細(xì) 編碼 通信 系統(tǒng) | ||
所屬技術(shù)領(lǐng)域
本發(fā)明涉及一種視頻通信系統(tǒng),對于視頻圖像某局部區(qū)域,可由系統(tǒng)自動或者人工互動的方法進行定義并精細(xì)編碼。
背景技術(shù)
現(xiàn)在通用的視頻通信編碼方法例如國際標(biāo)準(zhǔn)MPEG4(ISO/IEC?14496-2),H.264(ISO/IEC14496-10,ITU-T?Recommendation?H.264),我國標(biāo)準(zhǔn)AVS(GB/T?20090)等等,都是以宏塊(Macro?Block)為單位,結(jié)合運動估計和補償,進行編碼。一個宏塊是由圖像中相鄰的NxM個點組成的數(shù)據(jù)塊,N和M的取值可以是4,8,16,32等。
實際應(yīng)用的通信帶寬是有限的,必須將編碼碼率控制在一定范圍內(nèi)。在編碼比特分配上,現(xiàn)有公知的做法,是對于運動估計誤差較大的宏塊,分配較多的比特,對于運動估計誤差較小的宏塊,分配較少的比特,從而在碼率允許范圍內(nèi)有效地保持圖像的清晰度。
可是這種分配方法沒有考慮宏塊的圖像內(nèi)容對于通信信息的影響。例如對于視頻通信的主要應(yīng)用視頻監(jiān)控和視頻通話,圖像中人臉區(qū)域是用戶十分關(guān)心的重要部分,希望在編碼碼率允許條件下盡量清晰。
相對于視頻(運動圖像序列),靜止圖像編碼的JPEG2000(ISO?15444)技術(shù),用小波變換技術(shù),可以做到對某個用戶定義興趣區(qū)域(ROI,Region?Of?Interest)設(shè)置較高的編碼精細(xì)度。
可是小波變換主要針對靜止圖像,且運算量很大,目前還不適合應(yīng)用到運動圖像視頻實時通信系統(tǒng)當(dāng)中。
采用現(xiàn)有國際國內(nèi)標(biāo)準(zhǔn)方法的現(xiàn)有視頻通信系統(tǒng)尚無有效地對基于圖像內(nèi)容(而不是運動估計誤差大小)的區(qū)域進行局部精細(xì)編碼的。
發(fā)明內(nèi)容
為了克服現(xiàn)有的視頻通信系統(tǒng)沒有對基于圖像內(nèi)容的區(qū)域進行局部精細(xì)編碼的不足,本發(fā)明提供一種改進的視頻通信系統(tǒng),可以自動或互動的定義基于圖像內(nèi)容的區(qū)域,并進行局部精細(xì)編碼,讓通信系統(tǒng)傳輸?shù)囊曨l內(nèi)容更加具有實用價值。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:在視頻編碼部分增加重點區(qū)域描述參數(shù),描述重點編碼區(qū)域。增加一個自動的圖像內(nèi)容特征檢測算法或裝置,檢測感興趣的內(nèi)容位于圖像的具體局部位置。在視頻解碼部分,增加一種交互方法,可由用戶定義一個或多個重點局部區(qū)域。系統(tǒng)將根據(jù)自動檢測的或者由用戶定義的重點區(qū)域信息設(shè)置參數(shù)。編碼器根據(jù)該參數(shù),調(diào)整分配各個宏塊的編碼比特,達(dá)到對重點區(qū)域精細(xì)編碼的目的。
本發(fā)明的有益效果是,最終傳輸?shù)囊曨l當(dāng)中某些局部區(qū)域被重點精細(xì)編碼,從而使傳輸?shù)囊曨l圖像中該重點局部區(qū)域特別清晰,使通信系統(tǒng)的實用價值大大增加,例如使視頻監(jiān)控數(shù)字圖像中人臉區(qū)域相對更加清晰,更有利于刑偵破案和司法取證,或者更有利于人臉識別應(yīng)用,在帶寬十分受限的情況下價值更加明顯。
附圖說明
圖1是改進前編碼器結(jié)構(gòu)框圖,這是一個十分簡化的示意圖,是現(xiàn)在通用的視頻編碼標(biāo)準(zhǔn)的基本結(jié)構(gòu)。視頻變換一般是用DCT離散余弦變換。熵編碼一般是用Huffman哈夫曼編碼。量化一般是根據(jù)目標(biāo)誤差計算量化步長進行量化。
圖2是改進后編碼器結(jié)構(gòu)框圖,增加了對重點區(qū)域的檢測和設(shè)置,并對重點區(qū)域設(shè)置更高的量化精度要求進行精細(xì)量化編碼。圖中黑色方框中示意人臉區(qū)域。
具體實施方式
在視頻編碼部分增加重點區(qū)域描述參數(shù)R[N],N=0,R[0]=[X01,Y01,X02,Y02],X01,Y01是重點編碼區(qū)域的左上角點坐標(biāo),X02,Y02是重點編碼區(qū)域的右下角點坐標(biāo)。增加一個自動的圖像內(nèi)容特征檢測算法或裝置,檢測圖像中是否出現(xiàn)特征內(nèi)容例如人臉和其具體位置[X01,Y01,X02,Y02]。在視頻解碼部分,增加一種交互方法,提供解碼圖象的觀看,并可以接收鼠標(biāo)消息,可由用戶用鼠標(biāo)在圖像上框定一個或多個重點區(qū)域R[N],N=1,2,3,...,R[n]=[Xn1,Yn1,Xn2,Yn2]。系統(tǒng)將R[n]發(fā)送到編碼部分。編碼器根據(jù)自動檢測的和用戶定義的重點區(qū)域信息R[N],在對每一個宏塊進行編碼的時候,先搜索判斷宏塊是否覆蓋重點區(qū)域R[N],N=0,1,2,...,如果是,則減小該宏塊編碼時候的目標(biāo)誤差值,減小量化步長,使用更多的比特進行編碼,減小編碼誤差,對該宏塊進行更加精細(xì)的編碼,從而對整個重點區(qū)域精細(xì)編碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于吳平,未經(jīng)吳平許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810037647.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法





