[發明專利]一種用于內容自適應編碼中的場景分段方法有效
| 申請號: | 201911062052.0 | 申請日: | 2019-11-01 |
| 公開(公告)號: | CN110677657B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 萬俊青;王建偉;李小強 | 申請(專利權)人: | 杭州當虹科技股份有限公司 |
| 主分類號: | H04N19/137 | 分類號: | H04N19/137;H04N19/142;H04N19/14;H04N19/146;H04N19/179 |
| 代理公司: | 杭州橙知果專利代理事務所(特殊普通合伙) 33261 | 代理人: | 賀龍萍 |
| 地址: | 310012 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 內容 自適應 編碼 中的 場景 分段 方法 | ||
1.一種用于內容自適應編碼中的場景分段方法,其特征是,主要由兩部分組成,分別是IDR幀決定器和分段決定器,具體的操作步驟如下:
(1)通過IDR幀決定器來設置當前幀是否為IDR幀,如果當前幀是IDR幀則進入到步驟(2)中;否則,設置當前幀為P/B幀;IDR幀決定器的具體流程步驟如下:
(11)在下采樣圖像上計算每幀幀內預測代價intracost、幀間預測代價intercost、幀間像素差值絕對值和intersad,這里的預測數據采用原圖數據;
(12)如果當前幀較前一幀變化很大,設置成IDR幀,否則進入到步驟(13)中;
(13)如果當前幀較前一幀有很大可能突變,且其后N幀的變化緩慢,則將當前幀設置成IDR幀,否則進入到步驟(14)中;
(14)如果當前幀較前一幀有很大可能突變,前N幀變化緩慢,后N幀中變化大但沒有可能突變幀,或者后N幀變化緩慢,前N幀中變化大但沒有可能突變幀時,則將當前幀設置成IDR幀,否則進入到步驟(15)中;
(15)根據設置的GOP長度來判斷當前幀是否到了設置的GOP長度,如果到了則將當前幀設置成IDR幀;否則設置當前幀為P/B幀;
(2)根據分段決定器來確定當前幀是否開始分段,如果開始分段,則將當前幀作為新段編碼;否則,繼續本段編碼;分段決定器的具體流程步驟如下:
(21)如果當前幀是滿足IDR幀決定器中步驟(14)的IDR幀,則當前幀開始分段,作為新段編碼,否則進入到步驟(22)中;
(22)如果當前幀是IDR幀,前N幀的編碼復雜度和后N幀編碼復雜度相比變化很大,則當前幀開始分段,否則進入到步驟(23)中;
(23)如果當前幀是IDR幀,前N幀的運動量和后N幀運動量相比變化很大,則當前幀開始分段,否則繼續本段編碼。
2.根據權利要求1所述的一種用于內容自適應編碼中的場景分段方法,其特征是,在步驟(12)中,當前幀較前一幀變化很大的判斷條件為:當前幀的幀間預測代價和幀內預測代價的比值大于某個閾值T1,且幀內預測代價和前一幀幀內預測代價差值的絕對值與前一幀intracost的比值大于閾值T2;即:
3.根據權利要求2所述的一種用于內容自適應編碼中的場景分段方法,其特征是,在步驟(14)中,具體的操作步驟如下:
(141)統計前N幀和后N幀各自的幀間預測代價最大值premax和afermax,前N幀和后N幀各自的幀間預測代價最小值premin和aftermin;
(142)如果前N幀的變化緩慢,后N幀中沒有可能突變幀,且滿足premax和aftermin的比值小于閾值T6,則本幀為IDR幀,否則進入到步驟(143)中;
(143)如果后N幀的變化緩慢,前N幀中沒有可能突變幀,且滿足afermax和premin的比值小于閾值T6,則本幀為IDR幀,否則進入到步驟(15)中。
4.根據權利要求1所述的一種用于內容自適應編碼中的場景分段方法,其特征是,在步驟(22)中,IDR幀用幀內預測代價intracost代表編碼復雜度,P、B幀用幀間預測代價intercost代表編碼復雜度,N幀的編碼復雜度按以下公式計算:
costsum=IDR幀的cost總和*ipfactor+P幀的cost總和+B幀的cost總和*pbfacor;
其中:IDR幀的cost指的是幀內預測代價intracost,P幀的cost以及B幀的cost均指的是幀間預測代價intercost,ipfactor和pbfacor是2個預設的固定值;如果前N幀的編碼復雜度和后N幀的編碼復雜度差值的絕對值大于閾值T8,表示前N幀的編碼復雜度和后N幀編碼復雜度變化很大。
5.根據權利要求4所述的一種用于內容自適應編碼中的場景分段方法,其特征是,在步驟(23)中,幀間像素差值絕對值和intersad代表運動量,如果前N幀的平均運動量和后N幀的平均運動量差值的絕對值大于閾值T9,表示前N幀的平均運動量和后N幀平均運動量變化很大。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州當虹科技股份有限公司,未經杭州當虹科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911062052.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:執行調色板解碼的方法及解碼設備
- 下一篇:基于優先級的非相鄰Merge設計
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





