[發明專利]基于深度學習的自適應編碼方法及系統、設備、介質在審
| 申請號: | 202010728740.2 | 申請日: | 2020-07-26 |
| 公開(公告)號: | CN112019846A | 公開(公告)日: | 2020-12-01 |
| 發明(設計)人: | 魯國;王培;其他發明人請求不公開姓名 | 申請(專利權)人: | 杭州皮克皮克科技有限公司 |
| 主分類號: | H04N19/132 | 分類號: | H04N19/132;H04N19/85 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 徐紅銀 |
| 地址: | 310018 浙江省杭州市杭州經濟技術開發區*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 自適應 編碼 方法 系統 設備 介質 | ||
1.一種基于深度學習的自適應編碼方法,其特征在于,包括:
S11:輸入視頻,對所述輸入視頻中的每一幀進行基于深度學習的自適應降采樣,得到降采樣后的視頻;
S12:將所述S11得到的降采樣后的視頻進行編碼,然后將其壓縮到解碼端;
S13:在解碼端進行解碼;
S14:對解碼后的視頻進行視頻上采樣,得到重建視頻。
2.根據權利要求1所述的基于深度學習的自適應編碼方法,其特征在于,所述S11中的對所述輸入視頻進行基于深度學習的自適應降采樣具體包括:
S111:將所述輸入視頻降采樣到預設分辨率;
S112:對降采樣后的視頻中的每一幀進行基于深度學習的細化,得到最終的降采樣后的視頻。
3.根據權利要求2所述的基于深度學習的自適應編碼方法,其特征在于,所述基于深度學習的細化具體包括:
S1121:將輸入視頻中的每一幀經過多層卷積層以及平均池化層,得到降采樣后的特征;
S1122:將降采樣后的特征經過多層卷積層以及雙線性插值層,得到升采樣后的特征,得到細化后的視頻幀。
4.根據權利要求3所述的基于深度學習的自適應編碼方法,其特征在于,所述基于深度學習的細化包括:多層卷積神經網絡處理、平均池化層降采樣處理以及雙線性插值上采樣處理。
5.根據權利要求1所述的基于深度學習的自適應編碼方法,其特征在于,所述S11中的基于深度學習的自適應降采樣的降采樣倍數包括多個;
進一步地,所述S12與所述S13之間還包括:
S51:分別計算每個降采樣倍數對應的率失真性能,選擇率失真性能最好的降采樣倍數的編碼視頻進入所述S13。
6.根據權利要求1所述的基于深度學習的自適應編碼方法,其特征在于,所述S14中的視頻上采樣具體為采用線性差值的方法進行視頻上采樣,或,基于深度神經網絡進行視頻上采樣。
7.一種基于深度學習的自適應編碼系統,其特征在于,包括:基于深度學習的自適應降采樣模塊、編碼模塊、解碼模塊以及重建視頻模塊;其中,
所述基于深度學習的自適應降采樣模塊用于對輸入視頻進行基于深度學習的自適應降采樣,得到降采樣后的視頻;
所述編碼模塊與所述基于深度學習的自適應降采樣模塊相連,用于將所述基于深度學習的自適應降采樣模塊得到的降采樣后的視頻進行編碼,然后將其壓縮到解碼端;
所述解碼模塊與所述編碼模塊相連,用于在解碼端進行解碼;
所述重建視頻模塊與所述解碼模塊相連,用于對解碼后的視頻進行視頻上采樣,得到重建視頻。
8.根據權利要求7所述的基于深度學習的自適應編碼系統,其特征在于,所述基于深度學習的自適應降采樣模塊包括:降采樣模塊以及基于深度學習的細化模塊;其中,
所述降采樣模塊用于將所述輸入視頻降采樣到預設分辨率;
所述基于深度學習的細化模塊用于對降采樣后的視頻中的每一幀進行基于深度學習的細化,得到最終的降采樣圖像。
9.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時可用于執行權利要求1-6任一所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時可用于執行權利要求1-6任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州皮克皮克科技有限公司,未經杭州皮克皮克科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010728740.2/1.html,轉載請聲明來源鉆瓜專利網。





