[發明專利]一種基于強化學習的視頻圖像編碼壓縮效率提升方法有效
| 申請號: | 201810291528.7 | 申請日: | 2018-04-03 |
| 公開(公告)號: | CN110351558B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 陳宇;梅元剛;金星;朱政;丁丹丹 | 申請(專利權)人: | 杭州微幀信息科技有限公司 |
| 主分類號: | H04N19/124 | 分類號: | H04N19/124;H04N19/176;H04N19/70 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310000 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 強化 學習 視頻 圖像 編碼 壓縮 效率 提升 方法 | ||
1.一種基于強化學習的視頻圖像編碼壓縮效率提升方法,其特征在于:包括以下步驟,
步驟1,創建預測網絡和判別網絡,并完成網絡參數初始化,預測網絡負責決策圖像分塊對應的編碼策略參數最優值;判別網絡負責判別預測網絡生成的編碼策略參數好壞;
步驟2,輸入圖像組,由預測網絡得到各個圖像分塊的編碼策略參數p;
步驟3,根據各個圖像分塊的編碼策略參數執行編碼過程;
步驟4,編碼結果評分,在圖像組編碼完成以后,得到的壓縮效率綜合評分R;
步驟5,判別網絡估分,根據輸入圖像組以及預測網絡得到編碼策略參數p得到估分V;
步驟6,強化學習訓練迭代,更新預測網絡和判別網絡參數,并執行迭代過程;
步驟7,編碼決策,負責為視頻圖像編碼生成最優化的各個圖像分塊的編碼策略參數,提升編碼壓縮效率。
2.根據權利要求1所述的基于強化學習的視頻圖像編碼壓縮效率提升方法,其特征在于:圖像分塊對應的編碼策略參數,
所述圖像分塊對應的編碼策略參數,指對視頻圖像壓縮效率影響很大,且對不同視頻圖像內容有適配性的關鍵策略參數,包含各個圖像分塊的量化參數增量delta QP,或者率失真代價函數中的拉格朗日乘子lambda,這些策略參數通過傳統的方法很難求解全局最優值;
所述圖像分塊大小可為任意大小,包括16×16 ,64×64,128×128正方形, 或者長方形,Wedge based不規則形狀,分塊越小,求解過程越復雜,圖像分塊的概念與具體編碼標準無關,并不與具體標準的編碼單元、預測單元或者變換單元、分片slice、分段 segments綁定,具體應用的時候可以根據需要制定圖像分塊大小、形狀以及數目,各圖像分塊得出的編碼策略參數可以拆分或者組合,然后應用到具體的標準中。
3.根據權利要求1所述的基于強化學習的視頻圖像編碼壓縮效率提升方法,其特征在于:編碼結果評分,
所述編碼結果評分,是在對整幀視頻圖像,或者整段視頻圖像編碼完成之后,得到的壓縮效率綜合評分,包括根據碼率和質量評價得到的綜合評分;
所述質量評價包括全參考質量評價峰值信噪比PSNR和結構相似性指標SSIM;
所述編碼結果評分計算的最小單位為整幀視頻圖像編碼完成以后,不需要編碼過程中的額外計算或反饋,不需要對編碼器做定制化改動,與編碼器解耦,且能夠綜合反映圖像各個分塊之間的互相影響。
4.根據權利要求1所述的基于強化學習的視頻圖像編碼壓縮效率提升方法,其特征在于:預測網絡負責決策圖像分塊對應的編碼策略參數最優值,
所述預測網絡為由若干卷積層的級聯的卷積神經網絡,加上全連接層構成,預測網絡輸入為一組視頻圖像幀的原始像素值,輸出圖像各個分塊的編碼策略參數p,預測網絡的輸入為原始像素值,而不是從編碼過程中提取的參數,不需要編碼器的額外反饋,保持較弱的耦性性,預測網絡在實際推斷和編碼過程中,用作編碼器的前置模塊,得到預處理參數。
5.根據權利要求1所述的基于強化學習的視頻圖像編碼壓縮效率提升方法,其特征在于:判別網絡負責判別預測網絡生成的預測值好壞,
所述判別網絡為由若干卷積層的級聯的卷積神經網絡,加上全連接層構成,判別網絡負責判別預測網絡生成的預測值好壞,判別網絡僅在訓練中使用,推斷中不使用,判別網絡的輸入為預測網絡輸出的圖像各個分塊的編碼策略參數p,以及對應的圖像原始像素值;輸出為判別編碼策略參數好壞的估分V。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州微幀信息科技有限公司,未經杭州微幀信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810291528.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:視頻編碼中一種快速幀間預測編碼方法
- 下一篇:一種圖像編碼方法及裝置





