[發(fā)明專利]圖像劃分方法和裝置在審
| 申請?zhí)枺?/td> | 202110752745.3 | 申請日: | 2021-07-02 |
| 公開(公告)號: | CN113382245A | 公開(公告)日: | 2021-09-10 |
| 發(fā)明(設(shè)計)人: | 劉東;馮傲林;李禮 | 申請(專利權(quán))人: | 中國科學(xué)技術(shù)大學(xué) |
| 主分類號: | H04N19/147 | 分類號: | H04N19/147;H04N19/149;H04N19/96;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 劉翠香 |
| 地址: | 230026 安*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 劃分 方法 裝置 | ||
本申請?zhí)峁┝艘环N圖像劃分方法和裝置,本申請的方案在獲得圖像的編碼樹單元CTU之后,可以將CTU輸入到訓(xùn)練好的劃分深度識別模型,便可以得到CTU中各個基本單元的劃分深度,而基于CTU中各個基本單元的劃分深度便可以推導(dǎo)出該CTU中編碼單元的劃分方式,從而無需通過遞歸方式來確定CTU對應(yīng)的編碼單元劃分方式,也就避免了遞歸過程中頻繁計算率失真代價,從而降低了確定CTU的編碼單元劃分方式的復(fù)雜度和耗時。
技術(shù)領(lǐng)域
本申請涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖像劃分方法和裝置。
背景技術(shù)
HEVC(High Efficiency Video Coding,高效視頻編碼)標準是目前互聯(lián)網(wǎng)視頻數(shù)據(jù)主流的壓縮標準之一。HEVC引入了自適應(yīng)四叉樹的塊劃分技術(shù),帶來了十分可觀的編碼性能增益,同時也大幅度提升了編碼器復(fù)雜度。
自適應(yīng)四叉樹劃分在編碼過程中經(jīng)常通過率失真優(yōu)化(Rate–distortionoptimization,RDO)的方式,確定圖像的各編碼樹單元(Coding Tree Unit,CTU)的劃分方式。具體的,一幀圖像在被劃分為互不重疊的多個CTU之后,每個CTU會進一步被劃分為需要編碼的編碼單元(Coding Unit,CU),而將CTU劃分為CU是一個遞歸過程,需要遍歷CTU所有可能的CU劃分方式,并通過計算率失真代價來確定最優(yōu)的CU劃分方式。
然而,由于基于率失真優(yōu)化的方式劃分CTU需要遍歷所有的CU劃分方式,而每個CTU對應(yīng)的CU劃分方式較多,如,HEVC標準中采用的CTU尺寸(同時也是最大可能的CU尺寸)為64×64,最小CU尺寸為8×8。因此,一個CTU可能的劃分方式高達83522種,且每次計算率失真代價都需要耗費一定時長,從而使得CTU劃分過程的復(fù)雜度較高,耗時較長。
發(fā)明內(nèi)容
有鑒于此,本申請?zhí)峁┝艘环N圖像劃分方法和裝置,以降低圖像的CTU劃分的復(fù)雜度,減少了CTU劃分編碼單元所需的時間。
為實現(xiàn)上述目的,本申請?zhí)峁┝巳缦录夹g(shù)方案:
一方面,本申請?zhí)峁┝艘环N圖像劃分方法,包括:
獲得圖像中待劃分的編碼樹單元CTU;
將所述CTU輸入到劃分深度識別模型,得到所述劃分深度識別模型預(yù)測出的所述CTU的劃分深度特征,所述CTU的劃分深度特征包括所述CTU中各基本單元對應(yīng)的劃分深度,所述CTU包括K*K個互不重疊的基本單元,且每個基本單元由L*L個像素點構(gòu)成,其中,K=2n,n為大于等于1的自然數(shù),L為大于等于2的自然數(shù);其中,所述劃分深度識別模型為利用標注有實際劃分深度特征的多個CTU樣本訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型得到的,所述CTU樣本的實際劃分深度特征為基于率失真優(yōu)化方式確定出的所述CTU樣本中各個基本單元對應(yīng)的劃分深度;
基于所述CTU中各基本單元的劃分深度,確定所述CTU所需劃分出的至少一個編碼單元CU,并將所述CTU劃分為所述至少一個編碼單元CU。
又一方面,本申請還提供了一種圖像劃分裝置,包括:
劃分對象獲得單元,用于獲得圖像中待劃分的編碼樹單元CTU;
深度識別單元,用于將所述CTU輸入到劃分深度識別模型,得到所述劃分深度識別模型預(yù)測出的所述CTU的劃分深度特征,所述CTU的劃分深度特征包括所述CTU中各基本單元對應(yīng)的劃分深度,所述CTU包括K*K個互不重疊的基本單元,且每個基本單元由L*L個像素點構(gòu)成,其中,K=2n,n為大于等于1的自然數(shù),L為大于等于2的自然數(shù);其中,所述劃分深度識別模型為利用標注有實際劃分深度特征的多個CTU樣本訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型得到的,所述CTU樣本的實際劃分深度特征為基于率失真優(yōu)化方式確定出的所述CTU樣本中各個基本單元對應(yīng)的劃分深度;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)技術(shù)大學(xué),未經(jīng)中國科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110752745.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





