[發(fā)明專利]HEVC幀內(nèi)角度模式選擇方法、裝置、設備及可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 202010628727.X | 申請日: | 2020-07-02 |
| 公開(公告)號: | CN111800642B | 公開(公告)日: | 2023-05-26 |
| 發(fā)明(設計)人: | 李帥廠;陳小磊;劉俊;姜光心 | 申請(專利權(quán))人: | 中實燃氣發(fā)展(西安)有限公司 |
| 主分類號: | H04N19/593 | 分類號: | H04N19/593;H04N19/105;G06N3/0464;G06N3/08 |
| 代理公司: | 西安通大專利代理有限責任公司 61200 | 代理人: | 朱海臨 |
| 地址: | 710049 陜西省西安市高新*** | 國省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | hevc 角度 模式 選擇 方法 裝置 設備 可讀 存儲 介質(zhì) | ||
本發(fā)明屬于視頻編碼領域,公開了一種HEVC幀內(nèi)角度模式選擇方法、裝置、設備及可讀存儲介質(zhì),所述HEVC幀內(nèi)角度模式選擇方法包括獲取學習視頻幀圖像,劃分為若干PU圖像;構(gòu)建深度卷積神經(jīng)網(wǎng)絡,從PU圖像上學習預測出當前PU圖像的最佳角度模式,得到深度卷積神經(jīng)網(wǎng)絡預測模型,將深度卷積神經(jīng)網(wǎng)絡預測模型嵌入到HEVC原始的編碼流程中,通過深度卷積神經(jīng)網(wǎng)絡預測模型直接得到最佳的角度模式的n種模式候選列表,替代視頻幀圖像編碼時的35類角度模式。本方法將深度卷積神經(jīng)網(wǎng)絡引入到HEVC視頻編碼中,從原始輸入視頻幀圖像上學習適合解決PU角度模式選擇的問題,能夠保證視頻編碼的質(zhì)量,較好的解決視頻編碼過程中時間較長的問題。
技術(shù)領域
本發(fā)明屬于視頻編碼領域,涉及一種HEVC幀內(nèi)角度模式選擇方法、裝置、設備及可讀存儲介質(zhì)。
背景技術(shù)
新一代高效視頻編碼HEVC(High?Efficiency?Video?Coding)是最新的視頻編碼標準,幀內(nèi)角度模式選擇算法就是通過選擇最佳的角度模式,使視頻編碼后的編碼失真最小。HEVC中,一幅視頻圖像首先被劃分成若干個相互不重疊的編碼樹單元(Coding?TreeUnit,CTU),然后對CTU對應的預測塊(Prediction?Unit,PU)進行幀內(nèi)預測的35種角度模式全搜索,對于大小為64×64的預測塊找出相應的最優(yōu)率失真(Rate?Distortion,RD)代價值RdCost_0及其對應的預測模式,對于4個大小為32×32的PU分別計算出其對應的最優(yōu)率失真代價值RdCost_1、RdCost_2、RdCost_3和RdCost_4及其各自對應的預測模式,然后對四個PU對應的最優(yōu)率失真代價值求和得RdCost_5。比較RdCost_0和RdCost_5的值,如果前者小則不對當前編碼塊(Coding?Unit,CU)繼續(xù)劃分,否則把當前CU繼續(xù)劃分為四個子CU,在這個過程中,每次都會計算不同大小PU的35種角度模式,過程繁瑣,計算量過大。
近年來,深度卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNetwork,CNN)在圖像分析、語音識別和自然語言處理方面取得巨大成功,如果能通過深度學習對HEVC幀內(nèi)角度模式進行預測,就可以大大減少編碼復雜度。當前HEVC中角度模式預測主要是通過減少粗略模式選擇個數(shù)或者模式侯選列表中的個數(shù)進行優(yōu)化,而不是直接通過某種算法得到最佳的角度模式預測值。機器學習是人工智能的一個分支,機器學習就是通過算法,使得機器能從大量歷史數(shù)據(jù)中學習規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A測。其中深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。在2012年的ImageNet競賽上,Hinton和Alex設計的AlexNet網(wǎng)絡一舉拿到冠軍后,深度學習在圖片分類上的應用更加廣泛。現(xiàn)有的角度模式選擇算法已經(jīng)取得了很多成果,但將深度學習應用到角度模式選擇算法中有待進一步的研究。
目前,常見的方式有以下幾種。一種快速幀內(nèi)模式?jīng)Q策算法,通過使用基于梯度的方法來減少粗略模式?jīng)Q策和RD優(yōu)化的候選模式,從而降低HEVC幀內(nèi)計算復雜度。該方法的優(yōu)點是降低了幀內(nèi)編碼復雜度,但是整體降低的幅度不大,有待進一步的提升,最終也是通過粗略模式選擇得到需要進行RD優(yōu)化的候選模式。還有一種HEVC編碼器的快速幀內(nèi)模式?jīng)Q策,通過基于Hadamard成本的漸進式粗略模式搜索(Progressive?Rough?Mode?Search,pRMS)來選擇性地檢查潛在模式而不是遍歷所有候選者,即35種角度模式。pRMS將選擇較少的有效候選者用于隨后的率失真優(yōu)化量化(Rate?Distortion?OptimizationQuantification,RDOQ)以導出率失真最佳模式。以此來降低編碼復雜性。該方法的優(yōu)點是對于35種角度模式,是選擇性的進行遍歷,能夠提升編碼效率,缺點是還是保持減少遍歷的思維,沒有最有效的達到壓縮編碼效率的目的。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)中幀內(nèi)角度模式選擇的編碼復雜,選取過程繁瑣,計算量過大的缺點,提供一種HEVC幀內(nèi)角度模式選擇方法、裝置、設備及可讀存儲介質(zhì)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中實燃氣發(fā)展(西安)有限公司,未經(jīng)中實燃氣發(fā)展(西安)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010628727.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





