[發明專利]一種從H.264壓縮碼流中提取邊緣特征的方法有效
| 申請號: | 200910100964.2 | 申請日: | 2009-08-10 |
| 公開(公告)號: | CN101621691A | 公開(公告)日: | 2010-01-06 |
| 發明(設計)人: | 陳耀武;馮杰 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/50 |
| 代理公司: | 杭州天勤知識產權代理有限公司 | 代理人: | 褚超孚 |
| 地址: | 310027浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 264 壓縮 碼流中 提取 邊緣 特征 方法 | ||
技術領域
本發明涉及視頻分析技術領域,具體來說是一種從H.264壓縮碼流中提取邊緣特征的方法。
背景技術
基于內容的圖像檢索技術在多媒體信息領域起著重要的作用。由于人類視覺系統對亮度變化邊界即邊緣非常敏感,邊緣特征成為了圖像檢索中最為重要的特征之一。與其它的特征如顏色運動相比,邊緣特征通常作為圖像中形狀描述的重要來源。在像素域中進行基于邊緣特征的檢索已經取得了很好的效果。針對多媒體檢索,多媒體專家組織Moving?PicturesExperts?Group早在1998年就開始為多媒體描述接口標準MPEG-7提出提案,MPEG-7旨在為各類多媒體信息提供一種標準化的描述,該描述與多媒體的內容本身有關,這也極大促進了基于內容的圖像或視頻檢索技術的發展。在MPEG-7中針對圖像邊緣定義了一個邊緣直方圖描述符(EdgeHistogram?Descriptor),該描述符統計無方向、水平方向、垂直方向、45°方向和135°方向這五種方向的邊緣特征。在基于內容的圖像檢索算法中,都可以利用該邊緣直方圖描述符方便地對圖像內容進行描述并作為特征進行檢索。
最近基于新的視頻編碼標準H.264I幀編碼的圖像編碼方式也引起了圖像編碼組織的關注,通過對各種圖像編碼方式的對比顯示H.264Intra編碼方式與JPEG2000具有相近的編碼效率,尤其是在低分辨率時擁有更好的率失真性能。在H.264中,幀內編碼并不直接采用DCT變換來進行,而是采用整型DCT變換,并且在變換之前要先根據周圍的像素相似性對編碼塊進行預測得到殘差,再對殘差進行編碼。幀內預測(Intra?Prediction)是H.264區別于之前視頻編碼標準的一項重要改進,它充分利用了編碼圖像中空域的信息,極大提高了I幀的壓縮效率。在待編碼圖像中,具有邊緣的塊里沿著邊緣方向的像素具有相似的亮度值,編碼器比較容易選擇相近方向的預測模式。因此,邊緣特征與預測模式之間具有很大的關聯。
發明內容
本發明提供了一種基于H.264壓縮域的智能圖像檢索中提取邊緣特征的方法,解決圖像數據檢索過程中的特征提取問題。
一種從H.264壓縮碼流中提取邊緣特征的方法,包括以下步驟:
(1)輸入H.264壓縮域視頻流;
(2)H.264壓縮域視頻流通過可變長熵解碼并提取壓縮域視頻流中編碼宏塊的相關特征;
所述的編碼宏塊的相關特征包括編碼宏塊的宏塊模式特征和編碼宏塊DCT變換的系數特征;
(3)根據獲得的編碼宏塊的宏塊模式特征和編碼宏塊DCT變換的系數特征進行分析;
首先按照宏塊模式特征Intra16×16和Intra4×4對各個宏塊進行分類。
對于Intra16×16模式的宏塊,按照其預測方式的不同分為三種情況:水平預測模式時,根據其左方宏塊是否為水平預測模式來判斷該宏塊內部第二排的4×4塊是否選擇水平邊緣模式或無邊緣模式;垂直預測模式時,根據其上方宏塊是否為垂直預測模式來判斷該宏塊內部第二列的4×4塊是否選擇垂直邊緣模式或無邊緣模式;其它情況宏塊內部的4×4塊均選擇無邊緣模式。
對于Intra4×4模式的宏塊,則需要結合編碼宏塊DCT變換系數特征形成的預測殘差能量對各個4×4塊的邊緣特征進行具體分析。
(4)將分析后得到的4×4塊邊緣特征用直方圖方法來表示,作為整個圖像的邊緣特征。
可變長熵解碼屬于部分解碼,這一過程相對于全部解壓而言,只占對壓縮域視頻流全部解壓的10%的計算量,由此避免了由對H.264壓縮視頻流進行全部解壓所帶來的額外計算量,降低了整個特征提取的復雜度。
本發明方法使用H.264壓縮碼流內部信息提取特征,可以避免由解壓碼流帶來的額外計算,具有很高的運算效率。
附圖說明
圖1為本發明特征提取方法的流程框圖;
圖2為本發明在Intra16×16模式下提取邊緣特征的策略流程圖。
具體實施方式
如圖1所示,一種從H.264壓縮碼流中提取紋理特征的方法,包括以下步驟:
(1)得到H.264壓縮域視頻碼流;
(2)H.264壓縮域視頻碼流通過可變長熵解碼并提取H.264壓縮域視頻流中編碼宏塊的相關特征;
編碼宏塊的相關特征包括編碼宏塊的宏塊模式特征和編碼宏塊DCT變換的系數特征。
可變長熵解碼屬于部分解碼,這一過程相對于全部解壓而言,只占對H.264壓縮域視頻流全部解壓的10%的計算量。避免了由對H.264壓縮視頻流進行全部解壓所帶來的額外計算量,降低了整個特征提取過程的計算復雜度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910100964.2/2.html,轉載請聲明來源鉆瓜專利網。





