[發明專利]一種基于先入先出隊列的HEVC細粒度并行預測方法有效
| 申請號: | 201410005285.8 | 申請日: | 2014-01-06 |
| 公開(公告)號: | CN103763569B | 公開(公告)日: | 2016-11-09 |
| 發明(設計)人: | 宋利;趙亞楠;王嘉 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | H04N19/96 | 分類號: | H04N19/96;H04N19/159;H04N19/103 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 郭國中 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 先入先出 隊列 hevc 細粒度 并行 預測 方法 | ||
技術領域
本發明涉及一種圖像處理和視頻編碼領域的方法,具體是一種基于先入先出(FIFO,Fist?In?First?Out)隊列的HEVC編碼樹單元(CTU)內部并行預測方法。
背景技術
2013年1月國際電信聯盟(ITU)通過的新一代視頻編碼標準HEVC(High?Efficiency?Video?Coding)相比于上一代標準H.264/AVC,在主觀質量相同的前提下壓縮效率提高了一倍。但是,壓縮效率的提高是以計算復雜度的急劇上升為代價的,根據多方的測試和統計,HEVC比上一代標準H.264/AVC計算復雜度要高1~2個數量級。如何在保持高壓縮效率的同時降低編碼的復雜度,是HEVC應用和推廣面臨的一個迫切問題。
另一方面,由于物理因素的限制,單核處理器近些年的發展越來越緩慢,而多核(multi-core)和眾核(many-core)處理器發展迅速,為大型程序提供強大的并行處理能力,典型的產品有多核中央處理器(CPU)和眾核圖形處理器(GPU)。HEVC的編碼框架內存在很多的并行性可供研究,充分利用處理器提供的強大并行計算性能,為HEVC設計不同層次的并行化編碼策略,可以給HEVC編碼器帶來數倍甚至數十倍的速度提升。
發明內容
本發明針對HEVC編碼樹單元的最佳劃分和最佳預測模式判決問題,提供一種基于先入先出隊列的CU級并行預測方法。該方法針CTU內部不同CU的預測過程提供并行化便利,在無任何壓縮性能損失的同時還可以達到理論上的最大并行度。
為實現上述的目的,本發明所述的基于先入先出隊列的HEVC?CU級并行預測方法,包括如下步驟:
第一步,初始化:創建多個先入先出隊列即FIFO隊列,分別用于管理不同尺寸的CU或PU;
第二步,將CTU內所有CU或PU按尺寸分別壓入相應的FIFO隊列,入隊順序為相應尺寸CU或PU的四叉樹掃描順序;
第三步,各FIFO隊列同時工作,從各自的隊列中取出一個CU或PU進行預測,串行的兄弟CU或PU完成預測時,和它們所屬的父CU進行RD代價比較,選取代價較小的作為當前父CU層的最佳劃分和預測模式;
第四步,重復第三步,直到所有FIFO隊列均為空,得到該CTU的最佳劃分和最佳預測模式信息。
本發明的基本思想是允許CTU內的多個獨立CU同時進行預測,并用FIFO隊列管理CU間的同步。具體地,以幀內預測、CTU32x32、最大劃分深度3為例,一個CTU內存在一個32x32CU、4個16x16CU、16個8x8CU以及64個4x4CU,所有CU均是串行進行。CU的處理時間大致正比于其像素個數,因此,設一個CU4x4的處理時間為一個時間單位,則8x8、16x16和32x32分別需要4、16和64個時間單位,整個CTU需要64×1+16×4+4×16+1×16=256個時間單位才能確定其最佳劃分和每個劃分的最佳預測模式。本發明提出的并行化方法,可以在64個時間單位內完成整個過程,加速比256/64=4。考慮到64已經是最少所需時間(單是CU32x32就需要64個時間單位),因此本發明方法已經達到此配置下理論上的最大并行度。幀間預測時預測單元(PU,Prediction?Unit)的組合更多,但原理與此類似,最大并行度也為4。另外,本方法不受編碼配置的限制,不同的CTU大小、不同的劃分深度下本方法均可以達到相應配置下的最大并行度。
與現有技術相比,本發明具有以下有益效果:
本發明充分利用了CTU內部的并行性,可以達到CTU內部理論上的最大并行度,并且不會帶來任何壓縮性能損失,對CTU大小、劃分深度、幀內、幀間預測等編碼配置無特殊限制。
附圖說明
通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本發明的其他特征、目的和優點將會更加明顯:
圖1是CTU劃分和其坐標圖。
圖2是8x8矩陣的四叉樹掃描順序圖。
圖3是本發明對幀內(intra)預測實施例的示意圖。
圖4是對圖3第一個16x16CU部分的放大。
圖5是本發明對幀間(inter)預測實施例CU16x16部分的示意圖。
具體實施方式
下面結合具體實例對本發明進行詳細說明。以下實施將有助于本領域的技術人員進一步理解本發明,但不以任何形式限制本發明。應當指出的是,對本領域的普通技術人員來說,在不脫離本發明構思的前提下,還可以做出若干變形和改進。這些都屬于本發明的保護范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410005285.8/2.html,轉載請聲明來源鉆瓜專利網。





