[發(fā)明專利]用于低碼率視頻壓縮的微量處理在審
| 申請?zhí)枺?/td> | 202210363618.9 | 申請日: | 2022-04-08 |
| 公開(公告)號: | CN115209155A | 公開(公告)日: | 2022-10-18 |
| 發(fā)明(設(shè)計)人: | A·賈盧瓦;L·M·赫爾明格;R·G·D·A·阿澤維多;S·拉布羅齊;C·R·施羅爾斯;Y·薛 | 申請(專利權(quán))人: | 迪士尼企業(yè)公司;蘇黎世聯(lián)邦理工學(xué)院 |
| 主分類號: | H04N19/42 | 分類號: | H04N19/42;G06N3/04;G06N3/08 |
| 代理公司: | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 44205 | 代理人: | 何偉華 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 低碼率 視頻壓縮 微量 處理 | ||
1.一種系統(tǒng),包括:
基于機器學(xué)習(xí)(ML)模型的視頻編碼器,被配置為:
接收包括多個視頻幀的未壓縮視頻序列;
從所述多個視頻幀中確定第一視頻幀子集和第二視頻幀子集;
編碼所述第一視頻幀子集以產(chǎn)生第一壓縮視頻幀子集;
識別用于所述第一壓縮視頻幀子集的第一解壓縮數(shù)據(jù);
編碼所述第二視頻幀子集以產(chǎn)生第二壓縮視頻幀子集;和
識別用于所述第二壓縮視頻幀子集的第二解壓縮數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,識別所述第一解壓縮數(shù)據(jù)包括,在所述第一視頻幀子集的所述編碼期間過度擬合所述第一解壓縮數(shù)據(jù),并且其中,識別所述第二解壓縮數(shù)據(jù)包括,在所述第二視頻幀子集的所述編碼期間過度擬合所述第二解壓縮數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述第一視頻幀子集包括視覺上彼此類似的視頻幀,并且其中所述第二視頻幀子集包括,與所述第一視頻幀子集的所述視頻幀相比視覺上更彼此類似的其它視頻幀。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),進(jìn)一步包括基于ML模型的視頻解碼器;
所述基于ML模型的視頻編碼器進(jìn)一步被配置為:
將所述第一壓縮視頻幀子集、所述第二壓縮視頻幀子集、所述第一解壓縮數(shù)據(jù)和所述第二解壓縮數(shù)據(jù)發(fā)送至所述基于ML模型的視頻解碼器;
所述基于ML模型的視頻解碼器被配置為:
接收所述第一壓縮視頻幀子集、所述第二壓縮視頻幀子集、所述第一解壓縮數(shù)據(jù)和所述第二解壓縮數(shù)據(jù);
使用所述第一解壓縮數(shù)據(jù)解碼所述第一壓縮視頻幀子集;和
使用所述第二解壓縮數(shù)據(jù)解碼所述第二壓縮視頻幀子集。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述第一解壓縮數(shù)據(jù)專用于解碼所述第一壓縮視頻幀子集而不專用于所述第二壓縮視頻幀子集,并且所述第二解壓縮數(shù)據(jù)專用于解碼所述第二壓縮視頻幀子集而不專用于所述第一壓縮視頻幀子集。
6.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述基于ML模型的視頻解碼器包括人工神經(jīng)網(wǎng)絡(luò)(NN)。
7.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述基于ML模型的視頻解碼器包括微殘差網(wǎng)絡(luò)(Micro-Residual-Network,MicroRN),并且其中所述第一解壓縮數(shù)據(jù)與所述第二解壓縮數(shù)據(jù)僅包含所述微殘差網(wǎng)絡(luò)的權(quán)重。
8.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述基于ML模型的視頻編碼器包括高保真度壓縮(High-Fidelity Compression,HiFiC)編碼器,并且其中,所述基于ML模型的視頻解碼器,相比于不使用所述第一解壓縮數(shù)據(jù)和所述第二解壓縮數(shù)據(jù)的HiFiC解碼器,包括更少的參數(shù)。
9.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述基于ML模型的視頻編碼器包含HiFiC編碼器,并且其中所述基于ML模型的視頻解碼器被配置為,相比于不使用所述第一解壓縮數(shù)據(jù)和所述第二解壓縮數(shù)據(jù)的HiFiC解碼器,實現(xiàn)更快的解碼時間。
10.根據(jù)權(quán)利要求4所述的系統(tǒng),其中,所述第一解壓縮數(shù)據(jù)僅被接收一次以用于所述第一壓縮視頻幀子集的解碼,并且其中所述第二解壓縮數(shù)據(jù)僅被接收一次以用于所述第二壓縮視頻幀子集的解碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于迪士尼企業(yè)公司;蘇黎世聯(lián)邦理工學(xué)院,未經(jīng)迪士尼企業(yè)公司;蘇黎世聯(lián)邦理工學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210363618.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





