[發(fā)明專利]一種用于內(nèi)容自適應(yīng)編碼中的場(chǎng)景分段方法有效
| 申請(qǐng)?zhí)枺?/td> | 201911062052.0 | 申請(qǐng)日: | 2019-11-01 |
| 公開(公告)號(hào): | CN110677657B | 公開(公告)日: | 2022-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 萬俊青;王建偉;李小強(qiáng) | 申請(qǐng)(專利權(quán))人: | 杭州當(dāng)虹科技股份有限公司 |
| 主分類號(hào): | H04N19/137 | 分類號(hào): | H04N19/137;H04N19/142;H04N19/14;H04N19/146;H04N19/179 |
| 代理公司: | 杭州橙知果專利代理事務(wù)所(特殊普通合伙) 33261 | 代理人: | 賀龍萍 |
| 地址: | 310012 浙江省杭州市西*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 內(nèi)容 自適應(yīng) 編碼 中的 場(chǎng)景 分段 方法 | ||
本發(fā)明公開了一種用于內(nèi)容自適應(yīng)編碼中的場(chǎng)景分段方法。它主要由兩部分組成,分別是IDR幀決定器和分段決定器,具體的操作步驟如下:(1)通過IDR幀決定器來設(shè)置當(dāng)前幀是否為IDR幀,如果當(dāng)前幀是IDR幀則進(jìn)入到步驟(2)中;否則,設(shè)置當(dāng)前幀為P/B幀;(2)根據(jù)分段決定器來確定當(dāng)前幀是否開始分段,如果開始分段,則將當(dāng)前幀作為新段編碼;否則,繼續(xù)本段編碼本發(fā)明的有益效果是:以圖像復(fù)雜度和運(yùn)動(dòng)量變化為標(biāo)準(zhǔn)來劃分場(chǎng)景段,保證內(nèi)容自適應(yīng)編碼中合理更新碼率的設(shè)置,大大改善了運(yùn)動(dòng)量大或復(fù)雜場(chǎng)景的質(zhì)量。
技術(shù)領(lǐng)域
本發(fā)明涉及視頻處理相關(guān)技術(shù)領(lǐng)域,尤其是指一種用于內(nèi)容自適應(yīng)編碼中的場(chǎng)景分段方法。
背景技術(shù)
為了節(jié)省碼率,保證圖像質(zhì)量,編碼器將一個(gè)視頻按場(chǎng)景分多段,針對(duì)不同的視頻內(nèi)容采用不同的碼率編碼。編碼過程中,所需的碼率與圖像復(fù)雜度和運(yùn)動(dòng)量有關(guān),一般來說,圖像越復(fù)雜,運(yùn)動(dòng)量越大,所需的碼率越大,但由于視覺上時(shí)間掩碼效應(yīng),在圖像復(fù)雜度相差不大的情況下,運(yùn)動(dòng)量越大,所需碼率越少。
目前場(chǎng)景分段方法分兩類,一類是采用深度學(xué)習(xí)分類的方法將視頻粗糙分為新聞、足球、演唱會(huì)等;一類是基于圖像幀間內(nèi)容變化的場(chǎng)景切換檢測(cè)方法。第一類方法計(jì)算量大,且訓(xùn)練數(shù)據(jù)標(biāo)簽的獲得也需要大量的人力,比較難處理,第二類雖然計(jì)算量小,但無法區(qū)分同一場(chǎng)景中運(yùn)動(dòng)量的變化,且分段過多,雖然景場(chǎng)變化了,但內(nèi)容復(fù)雜度差不多,此時(shí)無須改變編碼碼率。另外分段過多,對(duì)編碼器來說,頻繁打斷了碼率控制模塊的連續(xù)性,從而增大碼率控制的難度,有可能損害兩段交接處圖像質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明是為了克服現(xiàn)有技術(shù)中存在上述的不足,提供了一種能夠改善圖像質(zhì)量的用于內(nèi)容自適應(yīng)編碼中的場(chǎng)景分段方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
一種用于內(nèi)容自適應(yīng)編碼中的場(chǎng)景分段方法,主要由兩部分組成,分別是IDR幀決定器和分段決定器,具體的操作步驟如下:
(1)通過IDR幀決定器來設(shè)置當(dāng)前幀是否為IDR幀,如果當(dāng)前幀是IDR幀則進(jìn)入到步驟(2)中;否則,設(shè)置當(dāng)前幀為P/B幀;
(2)根據(jù)分段決定器來確定當(dāng)前幀是否開始分段,如果開始分段,則將當(dāng)前幀作為新段編碼;否則,繼續(xù)本段編碼。
本發(fā)明以圖像復(fù)雜度和運(yùn)動(dòng)量變化為標(biāo)準(zhǔn)來劃分場(chǎng)景段,保證內(nèi)容自適應(yīng)編碼中合理更新碼率的設(shè)置,大大改善了運(yùn)動(dòng)量大或復(fù)雜場(chǎng)景的質(zhì)量。
作為優(yōu)選,在步驟(1)中,IDR幀決定器的具體流程步驟如下:
(11)在下采樣圖像上計(jì)算每幀幀內(nèi)預(yù)測(cè)代價(jià)intracost、幀間預(yù)測(cè)代價(jià)intercost、幀間像素差值絕對(duì)值和intersad,這里的預(yù)測(cè)數(shù)據(jù)采用原圖數(shù)據(jù);
(12)如果當(dāng)前幀較前一幀變化很大,設(shè)置成IDR幀,否則進(jìn)入到步驟(13)中;
(13)如果當(dāng)前幀較前一幀有很大可能突變,且其后N幀的變化緩慢,則將當(dāng)前幀設(shè)置成IDR幀,否則進(jìn)入到步驟(14)中;
(14)如果當(dāng)前幀較前一幀有很大可能突變,前N幀變化緩慢,后N幀中變化大但沒有可能突變幀,或者后N幀變化緩慢,前N幀中變化大但沒有可能突變幀時(shí),則將當(dāng)前幀設(shè)置成IDR幀,否則進(jìn)入到步驟(14)中;
(15)根據(jù)設(shè)置的GOP長(zhǎng)度來判斷當(dāng)前幀是否到了設(shè)置的GOP長(zhǎng)度,如果到了則將當(dāng)前幀設(shè)置成IDR幀;否則設(shè)置當(dāng)前幀為P/B幀。
作為優(yōu)選,在步驟(12)中,當(dāng)前幀較前一幀變化很大的判斷條件為:當(dāng)前幀的幀間預(yù)測(cè)代價(jià)和幀內(nèi)預(yù)測(cè)代價(jià)的比值大于某個(gè)閾值T1,且?guī)瑑?nèi)預(yù)測(cè)代價(jià)和前一幀幀內(nèi)預(yù)測(cè)代價(jià)差值的絕對(duì)值與前一幀intracost的比值大于T2;即:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州當(dāng)虹科技股份有限公司,未經(jīng)杭州當(dāng)虹科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911062052.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 內(nèi)容再現(xiàn)系統(tǒng)、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容提供裝置、內(nèi)容再現(xiàn)程序和內(nèi)容提供程序
- 內(nèi)容記錄系統(tǒng)、內(nèi)容記錄方法、內(nèi)容記錄設(shè)備和內(nèi)容接收設(shè)備
- 內(nèi)容服務(wù)系統(tǒng)、內(nèi)容服務(wù)器、內(nèi)容終端及內(nèi)容服務(wù)方法
- 內(nèi)容分發(fā)系統(tǒng)、內(nèi)容分發(fā)裝置、內(nèi)容再生終端及內(nèi)容分發(fā)方法
- 內(nèi)容發(fā)布、內(nèi)容獲取的方法、內(nèi)容發(fā)布裝置及內(nèi)容傳播系統(tǒng)
- 內(nèi)容提供裝置、內(nèi)容提供方法、內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法
- 內(nèi)容傳輸設(shè)備、內(nèi)容傳輸方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容發(fā)送設(shè)備、內(nèi)容發(fā)送方法、內(nèi)容再現(xiàn)設(shè)備、內(nèi)容再現(xiàn)方法、程序及內(nèi)容分發(fā)系統(tǒng)
- 內(nèi)容再現(xiàn)裝置、內(nèi)容再現(xiàn)方法、內(nèi)容再現(xiàn)程序及內(nèi)容提供系統(tǒng)
- 內(nèi)容記錄裝置、內(nèi)容編輯裝置、內(nèi)容再生裝置、內(nèi)容記錄方法、內(nèi)容編輯方法、以及內(nèi)容再生方法
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





