[發明專利]一種基于多域JND模型的視覺感知編碼方法有效
| 申請號: | 201710584419.X | 申請日: | 2017-07-18 |
| 公開(公告)號: | CN107241607B | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 郭杰鋒;胡鞏;黃聯芬 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | H04N19/60 | 分類號: | H04N19/60;H04N19/147;H04N19/61 |
| 代理公司: | 廈門南強之路專利事務所(普通合伙) 35200 | 代理人: | 馬應森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 jnd 模型 視覺 感知 編碼 方法 | ||
一種基于多域JND模型的視覺感知編碼方法,涉及視頻信息處理。首先利用時空頻多域JND模型,分別計算出DCT塊中每個變換系數的空域基本JND閾值、亮度掩蔽調制因子、對比度掩蔽調制因子以及時域掩蔽調制因子,得到每個變換系數時空頻多域JND閾值。然后在變換編碼的過程中,引入基于塊感知失真概率評估標準,通過一種自適應搜索算法尋找每個系數關于JND閾值的修正因子,得到變換系數抑制值。最后將原始的變換系數減去相應計算得出的最合適的抑制值,作為新的系數放入熵編碼階段。通過多域JND模型和塊感知失真概率的編碼抑制策略,在保證一定主觀質量的前提下,能有效降低編碼碼率,有助于進一步提高目前編碼標準的壓縮率。
技術領域
本發明涉及視頻信息處理,尤其是涉及一種基于多域JND模型的視覺感知編碼方法。
背景技術
隨著多媒體技術的發展,人們對于視頻分辨率的要求越來越高,2K、4K甚至8K的視頻都將在不久的將來普及,為了解決這些龐大的視頻數據的存儲和傳輸需求,視頻編碼標準應運而生。而目前最新的視頻編碼技術基于香農信息論,通過搜索多種編碼模式,從中尋找最優的編碼方式,而這一過程需要引入大量的計算來提高精確度,但目前隨著計算量的提升,其效果提升卻趨于平緩,說明基于這一編碼思想的編碼方式已進入發展的瓶頸期,尋找一種效果和計算量之比較高的編碼思想對于未來編碼技術的發展顯得尤為重要。
由于視頻的最終接收者是人(人眼),視頻編碼的根本目的是在保證一定視頻質量的前提下盡可能地降低碼率,而編碼和傳輸人眼無法察覺的信息顯然是對網絡傳輸和存儲設備的一種浪費。可以說,視頻編碼的最終目的是達到人眼感知的保真度而不是像素的保真度。在多年前,人們就已經開始關注人眼系統,但由于其涉及到生理學、心理學等多個學科,相應的基礎理論還并不成熟,人眼的一些特性還并不能很好的解釋,同時在數字信號處領域,編碼壓縮率還有可進一步提升的空間,因此到目前為止,所有的編碼標準都沒有考慮進人眼特性來提高壓縮效率。
但隨著近年來,數字信號處理理論的約束以及人眼相關學科基礎理論的發展,研究人員開始重新關注人眼系統,期望將人眼系統中的某些已經明確特性應用到視頻編碼中,以達到進一步壓縮碼率的目的。這一研究思想被稱為視覺感知編碼,即結合人眼視覺系統的某些特性去除視頻中的視覺冗余部分,在達到視頻的感知保真度的情況下,進一步壓縮視頻。而目前一些相關的模型也被提出,如基于人眼感知失真的最小可感知失真模型、基于人眼感興趣區域的視覺顯著性模型等。通過這些模型可以表示出人眼視覺信息處理的過程,而尋找能準確表現人眼視覺信息處理過程的模型就是目前視頻編碼領域所要解決的關鍵問題,視頻編碼技術也將因這一問題的解決走出目前發展的瓶頸期。
文獻[1](Luo Z,Song L等,H.264/Advanced Video Control PerceptualOptimization Coding Based on JND-Directed Coefficient Suppression.IEEETransactions on CircuitsSystems for Video Technology,2013,23(6):935-948)提出了一種完整的時空頻域JND模型。在JM14.2上測試,在高效配置下節省了28.32%的碼率。
文獻[2](Bae SH,Kim J等,HEVC-based Perceptually Adaptive Video Codingusing a DCT-based Local Distortion Detection Probability Model.IEEETransactions on Image Processing,2016,25(7):3343-3357)提出了一種基于塊感知失真概率的編碼抑制策略,在滿足感知失真概率小于50%的情況下可以進一步壓縮碼率。在HM11.0上測試,在LOW-DELAY配置下節省了12.10%的碼率,在RANDOM-ACCESS配置下節省了9.90%的碼率。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710584419.X/2.html,轉載請聲明來源鉆瓜專利網。





