[發明專利]面向對象的視頻控制流的編碼及傳輸方法有效
| 申請號: | 201410075891.7 | 申請日: | 2014-03-04 |
| 公開(公告)號: | CN103826123B | 公開(公告)日: | 2017-01-18 |
| 發明(設計)人: | 祝斐;舒俊;袁葆春 | 申請(專利權)人: | 無錫海之量軟件科技有限公司 |
| 主分類號: | H04N19/20 | 分類號: | H04N19/20;H04N19/136;H04N19/85 |
| 代理公司: | 無錫市大為專利商標事務所(普通合伙)32104 | 代理人: | 曹祖良 |
| 地址: | 214194 江蘇省無錫市錫山*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 對象 視頻 控制 編碼 傳輸 方法 | ||
技術領域
本發明涉及一種編碼及傳輸方法,尤其是一種面向對象的視頻控制流的編碼及傳輸方法,屬于視頻處理的技術領域。
背景技術
隨著近年來數字視頻處理系統的推廣應用,這個領域也投入了大量的探索研究工作。前沿研究出現在不同的數字視頻應用領域,比如視頻壓縮,視頻對象提取,以及視頻分析等等。但是總的說來,這些研究歸入兩類:視頻的內容和視頻的屬性。
視頻壓縮的標準和技術,一直在努力用最少的數據,來維持可接受的圖像質量,比如MPEG2,MPEG4和H.264。另外,也有與此對應的壓縮視頻打包及傳輸的標準,如RTP/RTSP用于實時視頻串流,而MP4/AVI/MOV/用于多媒體文件的包裝。簡而言之,這些研究開發主要集中視頻內容的壓縮,傳輸和存儲。
另一方面,智能視頻更多的關心視頻對象的抽象,比如對象檢測和識別,對象跟蹤,對象匹配和搜索等。這個領域的研究,通過對視頻屬性的提取,極大的增加了觀眾與視頻內容互動的可能性。換句話說,面向對象的視頻處理開啟了新興智能互動視頻應用的大門。
已經有很多基于視頻對象的研究試驗。但是,幾乎都局限于對象本身及其使用。僅僅有限的研究觸及了面向對象的控制流。這種控制流或在視頻流中鑲嵌,或單獨串流。總之,基于對象的控制流是智能互動視頻的基礎,需要更多的探索和研究。
一般地,視頻對象信息的傳輸是以幀為單位的。換句話說,對象描述與特定的幀綁定。如圖1所示;用幀的標記數以及對象在本幀中的幾何位置來索引對象。這樣來打包對象及其控制信息會給視頻內容本身的串流增加可觀的超載。一幅壓縮的H.2644CIF(720x480)P幀會小到只有幾百字節,而對象屬性和控制信息卻要占10%的寶貴帶寬。所以應該研究壓縮傳輸對象屬性和控制信息的方法。
發明內容
本發明的目的是克服現有技術中存在的不足,提供一種面向對象的視頻控制流的編碼及傳輸方法,其操作方便,能有效降低傳輸負載,適應范圍廣,安全可靠。
按照本發明提供的技術方案,所述面向對象的視頻控制流的編碼及傳輸方法,在視頻壓縮流的n個壓縮幀后間插有具有對象控制的壓縮幀,所述具有對象控制的壓縮幀包括對象控制信息,所述對象控制信息包括n個壓縮幀中對每一個視頻對象均進行控制關聯的對象控制單元,其中,所述對象控制單元中用多項式來描述視頻對象的空間屬性以及時間屬性。
所述對象控制單元中還包括對象標識及標識頭、對象操作描述及對象形狀描述。
所述一個視頻對象的空間屬性、時間屬性、對象識別碼、對象操作描述以及對象形狀描述均封裝于同一個對象控制單元中。
所述對象控制單元中用多項式來描述視頻對象的水平位移及垂直位移描述,以對視頻對象的空間屬性以及時間屬性進行描述;對象控制單元中,對視頻對象的水平位移及垂直位移描述包括等式識別碼、多項式參數以及所述多項式參數與壓縮幀對應的數目。
所述描述視頻對象的空間屬性以及時間屬性的多項式包括一階多項式、二階多項式或三階多項式。
所述對象控制信息內的多個對象控制單元組裝成控制數據流。
所述控制數據流與壓片壓縮流內的壓縮幀關聯后獨立傳輸。
本發明的優點:壓縮幀與具有對象控制的壓縮幀形成組合幀,具有對象控制的壓縮幀包括對象控制信息,對象控制信息、包含對象控制單元,所述對象控制單元中用多項式來描述視頻對象的空間屬性以及時間屬性,以用最少的數據量來描述視頻對象的位移信息,使得視頻控制流的額外負載降低到最小,適應范圍廣,安全可靠。
附圖說明
圖1為現有視頻幀序列以及視頻對象的表述示意圖。
圖2為現有視頻控制流的封裝示意圖。
圖3為現有視頻對象在二維空間移動的示意圖。
圖4為視頻對象在水平方向移動的示意圖。
圖5為視頻對象在垂直方向移動的示意圖。
圖6為本發明的編碼封裝示意圖。
具體實施方式
下面結合具體附圖和實施例對本發明作進一步說明。
如圖1所示,是一個視頻的幀序列及視頻對象的示意圖。其中101是這段視頻的起始幀。在視頻序列內每幀視頻幀中都有幾個不同形狀的視頻對象102。顯然,每個單獨的視頻幀存在于二維空間,水平坐標用X軸104表示,垂直坐標用Y軸103表示。左上角是這個二維空間的坐標原點。除此之外,時間T軸106用來描述時間信息105,圖1中視頻序列的時間信息105起于時間點T0終于時間點Tn。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于無錫海之量軟件科技有限公司,未經無錫海之量軟件科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410075891.7/2.html,轉載請聲明來源鉆瓜專利網。





