[發(fā)明專利]一種基于SSIM評價的視頻編碼模式選擇方法、系統(tǒng)有效
| 申請?zhí)枺?/td> | 201210301141.8 | 申請日: | 2012-08-22 |
| 公開(公告)號: | CN103634600A | 公開(公告)日: | 2014-03-12 |
| 發(fā)明(設計)人: | 劉延偉;趙平華;要瑞宵;慈松 | 申請(專利權)人: | 中國科學院聲學研究所 |
| 主分類號: | H04N19/147 | 分類號: | H04N19/147;H04N19/19 |
| 代理公司: | 北京法思騰知識產權代理有限公司 11318 | 代理人: | 楊小蓉;楊青 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ssim 評價 視頻 編碼 模式 選擇 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及視頻編碼與通信領域,特別涉及一種基于SSIM評價的視頻編碼模式選擇方法、系統(tǒng)。
背景技術
隨著網絡技術的快速發(fā)展,多媒體應用,特別是視頻應用得越來越廣泛。由于傳輸帶寬的限制,視頻編碼與壓縮對高效的視頻通信起著重要的作用。H.264/AVC編碼已經取得了很好的壓縮性能和廣泛的應用。H.264/AVC標準其較好地編碼性能得益于它所采用的率失真優(yōu)化(rate-distortion?optimization,RDO)模型與一系列的編碼模式等。所述率失真優(yōu)化RDO中所采用的客觀的失真描述方式(如SAD,MSE等)具有計算簡單實現簡單的優(yōu)點,但其并不能很好的體現人的視覺特性,因此H.264/AVC中已有的RDO模型并沒有很好的考慮到人類的視覺特性。
近年來的研究表明,主觀視覺結構相似性SSIM在視頻質量評價中相對于以往的失真評價方法在人類視覺特性匹配上具有一定的優(yōu)越性。因此現有技術將主觀視覺結構相似性SSIM引入到了H.264/AVC編碼的預測模式和宏塊模式選擇中,實驗結果表明主觀視覺結構相似性SSIM的引入在一定程度上提高了編碼性能,較以往的SAD等失真描述方式,在相同的碼率下,更能夠提高人視覺感知到的視頻質量。
但是,雖然現有技術將主觀視覺結構相似性SSIM作為RDO模式選擇的失真度量被引入到了H.264/AVC的編碼過程中,提高了編碼后的重構視頻的視覺感知質量,但目前的方法都引入了一定的計算復雜度,文獻[Huang,Y.H.,Ou,T.S.,Su,P.Y.,Chen,H.:Perceptual?rate-distortion?optimization?using?structural?similarity?index?as?quality?metric.IEEE?Trans.CSV?T,1614-1624(November?2010)]中,作者采用對關鍵幀重復編碼兩次的方式來預測以后幾幀的拉格朗日因子,并不利于實時編碼的應用。特別是在率失真優(yōu)化模型中拉格朗日因子決策過程中,其與視頻內容相關的特性,以及傳統(tǒng)基于均方誤差評價的率失真優(yōu)化模型中拉格朗日因子的優(yōu)勢沒有被很好的利用,導致現有技術并不能取得最優(yōu)的編碼性能。
發(fā)明內容
本發(fā)明的目的在于,解決如何利用SSIM指導,進行低復雜度主觀率失真優(yōu)化視頻編碼,提高視頻編碼的主觀質量,即本發(fā)明提供一種基于SSIM評價的視頻編碼模式選擇方法、系統(tǒng)。
為了實現上述目的,本發(fā)明提供了一種基于SSIM評價的視頻編碼模式選擇方法,所述的方法包含:
步驟101)采用以下公式建立率失真優(yōu)化模型,用于對每一個待編碼的宏塊獲取其各種編碼模式的拉格朗日代價值:
其中,J表示某種編碼模式的拉格朗日代價值,代表基于待編碼宏塊對應某種編碼模式的SSIM評價的失真值,是該待編碼宏塊對應的拉格朗日因子,R表示待編碼宏塊的某種編碼模式的編碼需要的比特數;
步驟102)根據當前待編碼宏塊所屬幀的前兩幀的基于SSE評價的失真值和基于SSIM評價的失真值之間比值的平均值,確定該幀的幀層次的拉格朗日因子然后利用所述待編碼宏塊的重要性測量對得到的幀層次的拉格朗日因子進一步縮放,求得該待編碼宏塊的宏塊層次的拉格朗日因子
步驟103)依據獲取的當前待編碼宏塊的的值,計算當前編碼宏塊的各種編碼模式的拉格朗日代價值,最后選擇拉格朗日代價值最小的編碼模式作為當前待編碼宏塊的編碼模式進行編碼;
其中,所述編碼模式包含:幀內16×16,幀內8×8,幀內4×4,幀間16×16,幀間16×8,幀間8×16,幀間8×8,幀間8×4,幀間4×8,幀間4×4,跳過模式以及直接模式。
上述技術方案中,所述步驟101)還包含:
用于獲取每個宏塊的基于SSIM評價的失真值的步驟,該失真值表現為原始圖像和重構圖像之間的結構相似性度量,對于第n幀,第m個宏塊的SSIM失真,具體計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所,未經中國科學院聲學研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210301141.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多功能煙花炮筒引線絞紗機
- 下一篇:一種硬盤驅動器懸臂結構





