[發明專利]基于視覺感知的多視點快速模式選擇方法有效
| 申請號: | 201310444517.5 | 申請日: | 2013-09-26 |
| 公開(公告)號: | CN103533348B | 公開(公告)日: | 2017-02-01 |
| 發明(設計)人: | 王永芳;商習武;羅麗冬;張兆楊 | 申請(專利權)人: | 上海大學 |
| 主分類號: | H04N19/00 | 分類號: | H04N19/00;H04N19/50;H04N19/103;H04N19/147;H04N19/91;H04N19/625;H04N13/00 |
| 代理公司: | 上海上大專利事務所(普通合伙)31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 視覺 感知 視點 快速 模式 選擇 方法 | ||
技術領域
本發明涉及多視點編碼技術領域,特別是利用恰可辨失真模型進行快速模式選擇,提高了視頻編碼效率,便于網絡通信。
背景技術
隨著信息技術的發展,人們已經不滿足于二維視頻帶來的視覺享受,而是追求更加身臨其境的3D視頻。3D視頻在給人們帶來新的視頻盛宴的同時,對現有的網絡通信技術也提出了更大的挑戰。由于3D視頻需要編碼傳輸多路的視頻信息,它的數據量相對于傳統的單路視頻增加了幾倍。為此,視頻編碼聯合開發小組制定了多視點視頻編碼標準,提高了視頻的壓縮效率。但是,視頻編碼復雜度的增加阻礙了多視點編碼技術在實際中的應用。為此,廣大視頻研究者對多視點視頻編碼框架進行優化,提高視頻的編碼效率。
多視點編碼技術是基于宏塊編碼,對于一幀圖像的不同紋理和運動區域,找到最佳的參考幀,并采取窮盡所有的塊預測模式,最終找到最優的預測模式。這種窮盡算法雖然能夠獲得最佳的編碼性能,但是也大大增加了編碼復雜度。
經過試驗發現:在不同的圖像區域里,各種參考幀和預測模式的選取概率是不同的。對于運動快的區域,通常選取相鄰視點的參考幀。這是因為在視點內的參考幀中進行運動搜索,其搜索的運動矢量相當的大;而使用相鄰視點的參考幀,由于只是攝像機拍攝的角度差異,其搜索的視差矢量比視點內搜索出的運動矢量小很多,所以只有在運動快的區域,才會進行視點間的參考,反之,在運動緩慢區域只使用視點內的參考幀。當我們檢測出圖像的某區域運動很緩慢,直接剔除視點間的參考幀,可以提高視頻的編碼效率。在紋理平滑的區域,由于紋理特性一致,適合大的塊預測模式;在紋理復雜的區域,由于紋理的無規律性,需要用較小塊進行預測。
因此,通過分析圖像的特性,我們可以提前選取參考幀和塊預測模式。恰可辨失真模型正是在分析圖像的基本特性的情況下建立的,為此通過恰可辨失真閾值,選擇不同的參考幀進行不同的塊大小預測,可以提高視頻的編碼效率。
發明內容??????????????
本發明的目的是針對已有技術存在的缺陷,提供基于視覺感知的多視點快速模式選擇方法,該方法通過恰可辨失真閾值的不同,通過提前選擇不同參考幀和預測模式,來達到提高視頻編碼效率的目的。
為達到上述目的,本發明采用如下的技術方案:
基于視覺感知的多視點快速模式選擇方法,其特征在于操作步驟如下:
(1)?讀取B視點輸入視頻的每幀像素值,建立時域的恰可辨失真閾值模型;
(2)?利用恰可辨失真模型,進行感知模式選擇;
(3)?輸出視頻比特流。
本發明的基于視覺感知的多視點快速模式選擇方法與已有技術相比較,具有如下顯而易見的突出實質性特點和顯著技術進步?:
1)、該快速編碼方法與原有的多視點參考方法相比,平均時間縮短了82%;
2)、該快速編碼方法在提高編碼效率的同時,其編碼性能與參考代碼的編碼性能幾乎一致。
附圖說明
圖1是本發明中的基于視覺感知的多視點快速模式選擇方法的原理框圖。
圖2是時域的恰可辨失真模型的框圖。
圖3是進行感知模式選擇的框圖。
圖4是輸出比特流的框圖。
圖5是視頻測試序列champagne在本發明提出的方法和多視點編碼參考方法下的率失真代價曲線的對比圖。
圖6是四種有代表性的測試序列在本發明方法下,PSNR,比特率和編碼時間相對于參考方法的變化情況。
具體實施方式
以下結合附圖對本發明的優選實施例作進一步的詳細說明:
實施例一:
本實施例基于視覺感知的多視點快速模式選擇方法,參見圖1,包括以下步驟:
(1)?讀取B視點輸入視頻的每幀像素值,建立時域的恰可辨失真模型;
(2)?利用恰可辨失真模型,進行感知模式選擇;
(3)?輸出視頻比特流。
實施例二:本實施例與實施例一基本相同,特別之處如下:
上述步驟(1)中讀取B視點輸入視頻的每幀像素值,建立時域的恰可辨失真模型包括兩個模型,參見圖2:
(1-1)求出紋理恰可辨失真子模型???????????????????????????????????????????????,其公式為:
其中為通過canny算子檢測到的邊緣點的個數,為宏塊的邊長;
(1-2)計算時域掩蓋恰可辨失真子模型曲線表示如下:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310444517.5/2.html,轉載請聲明來源鉆瓜專利網。





