[發明專利]一種基于宏塊分類的快速高效編轉碼方法無效
| 申請號: | 201210135782.0 | 申請日: | 2012-05-03 |
| 公開(公告)號: | CN102665077A | 公開(公告)日: | 2012-09-12 |
| 發明(設計)人: | 黃鐵軍;耿銘超;張賢國;田永鴻;高文 | 申請(專利權)人: | 北京大學 |
| 主分類號: | H04N7/26 | 分類號: | H04N7/26;H04N7/32 |
| 代理公司: | 北京市商泰律師事務所 11255 | 代理人: | 毛燕生 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分類 快速 高效 編轉碼 方法 | ||
技術領域
本發明涉及數字視頻編解碼技術領域,一種基于宏塊分類的快速高效編轉碼方法。
背景技術
視頻編轉碼技術是數字視頻處理的關鍵技術,針對未壓縮或已壓縮視頻文件,通過高性能、快速的編轉碼算法,可以將較大的視頻文件壓縮為占用空間更小的二進制文件。視頻編轉碼技術在實際中都有著廣泛的應用。例如視頻會議,視頻錄制,數字視頻在復雜帶寬下傳輸,各種終端設備上自適應播放視頻以及不同視頻格式之間相互轉換等。眾多實際應用更加凸顯了視頻編轉碼技術的重要性,同時視頻的應用要求編轉碼技術的快速、實時、多路超實時編轉碼。因而,快速高效的視頻編轉碼技術成為越來越急需的實用技術。
一般的視頻編轉碼算法通過快速模式決策、快速運動搜索算法對未壓縮視頻文件進行快速編碼,或者通過利用現有已壓縮的視頻文件中編碼信息,來大幅減少再次轉壓縮的復雜度。當前主流的快速編轉碼技術包含幀間、幀內的快速模式決策,運動搜索簡化等。然而視頻背景內容中包含有利于提高編轉碼效率的信息,一般的編轉碼算法沒有充分的利用視頻背景內容信息。
最近發展的視頻編轉碼技術證明,基于視頻內容的背景建模編轉碼技術,相比不利用視頻背景信息的一般的編轉碼算法,可以實現較大的性能增益。針對視頻背景特性,基于解碼重建圖像進行訓練得到背景圖像用于預測編碼(黃鐵軍,張賢國,梁路宏,黃倩,高文.一種基于背景建模的靜態攝像機視頻壓縮方法與系統.專利申請號201010034117.3),該方法可以獲得較高的性能提升,相比一般的編轉碼方式可以節省一半以上的碼率。
雖然基于視頻內容的背景建模編轉碼技術可以獲得較高的性能提升,但是編轉碼的復雜度并沒有降低,而且視頻的背景信息也未被用于降低編轉碼復雜度。所以將視頻的背景內容應用于提升編轉碼速度成為研究的熱點。
發明內容
本發明解決的技術問題在于如何縮減編碼或轉碼復雜度,并且保持顯著的壓縮效率。
為了解決以上問題,本發明提出了一種基于宏塊分類的快速高效編轉碼方法,該方法利用視頻圖像塊不同的特征信息,將圖像內所有圖像塊進行分類,對不同類別的圖像塊使用不同的優化加速策略。
本發明提出的快速高效編轉碼方法,其主要步驟包括:
a)視頻信息獲取步驟:如果輸入為原始數據,則直接進行數字化采樣得到原始數據;如果輸入為已壓縮視頻,則應首先對壓縮視頻解碼獲取視頻信息,包括每個圖像塊的解碼結果和編碼工具使用情況信息;
b)背景圖像獲取步驟:編碼時利用解碼圖像、輸入原始圖像或者重建圖像進行訓練,得到背景圖像,或由外部輸入已有的背景圖像;
c)背景圖像選擇性的編入位流步驟:根據背景圖像的獲取方法來選擇是否將背景圖像編入位流;
d)編轉碼優化步驟:對圖像塊進行分類,并將分類信息用于編碼或轉碼優化中,解碼得到的工具使用情況信息會被重用于再編碼過程。
進一步,作為一種優選方案,在視頻信息獲取步驟中,如果輸入為已壓縮視頻,提取的編碼工具使用情況信息包括:參考幀索引號、尺寸模式,變換方法,預測方式,量化參數,環路濾波方式,熵編碼方法,位寬度信息,位寬度擴展情況,深度信息和運動向量信息。
進一步,作為一種優選方案,背景圖像獲取步驟中所使用的背景圖像獲取方法包含:
a)如果輸入為未壓縮視頻,則利用輸入原始圖像進行背景建模,或
b)如果輸入為已壓縮視頻,則利用解碼圖像進行背景建模,或
c)利用重建圖像進行背景建模,或
d)由外部直接輸入已有的背景圖像。
進一步,作為一種優選方案,背景圖像選擇性的編入位流步驟中,使用了輸入原始圖像、解碼圖像訓練或者外部輸入得到的背景圖像需要被編入位流,僅由重建圖像訓練得到的背景圖像不會編入位流。
進一步,作為一種優選方案,所述編轉碼優化步驟包括以下步驟:
a)類別劃分步驟:利用背景圖像,將當前圖像內的所有圖像塊進行分類,劃分為不同特性的圖像塊類別,
b)基于分類的編轉碼優化步驟:將分類信息應用于編碼或轉碼優化中,對不同類別的圖像塊或區域采用不同的編碼或轉碼優化過程。
進一步,作為一種優選方案,編轉碼優化步驟中在對圖像塊進行分類時,采用至少一種如下的分類策略:
a)按照圖像塊的前背景屬性進行劃分,劃分成前景、背景或者前背景邊緣塊,或
b)按照圖像塊的運動屬性進行劃分,劃分成大幅運動圖像塊,靜止圖像塊或小幅運動圖像塊,或
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210135782.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:非線性光學晶體硼酸氧鎘釓
- 下一篇:帶局域網控制功能的顯示終端





