[發明專利]圖像壓縮模型的訓練方法及裝置、圖像壓縮方法及裝置在審
| 申請號: | 202010784856.8 | 申請日: | 2020-08-06 |
| 公開(公告)號: | CN114071164A | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 孫振鉷;孫修宇;譚志羽;李昊;錢一琛 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04N19/70 | 分類號: | H04N19/70;G06N3/08 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 李曉慶 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 壓縮 模型 訓練 方法 裝置 | ||
1.一種圖像壓縮模型的訓練方法,包括:
獲取樣本圖像、目標碼率參數和目標全連接參數;
將所述樣本圖像、所述目標碼率參數和所述目標全連接參數輸入至待訓練的圖像壓縮模型,獲得所述樣本圖像對應的目標圖像;
根據所述樣本圖像和所述目標圖像計算損失值;
根據所述損失值訓練所述圖像壓縮模型,直至達到訓練停止條件。
2.如權利要求1所述的圖像壓縮模型的訓練方法,所述圖像壓縮模型包括編碼器和解碼器;
將所述樣本圖像、所述目標碼率參數和所述目標全連接參數輸入至待訓練的圖像壓縮模型,獲得所述樣本圖像對應的目標圖像,包括:
根據所述目標碼率參數和所述目標全連接參數確定目標碼率;
將所述樣本圖像和所述目標碼率輸入至所述編碼器,獲得所述樣本圖像對應的圖像特征向量;
將所述圖像特征向量和所述目標碼率輸入至所述解碼器,獲得所述樣本圖像對應的目標圖像。
3.如權利要求2所述的圖像壓縮模型的訓練方法,所述編碼器包括n個依次連接的編碼卷積層,其中,n>1;
將所述樣本圖像和所述目標碼率輸入至所述編碼器,獲得所述樣本圖像對應的圖像特征向量,包括:
將所述樣本圖像和所述目標碼率輸入至第一個編碼卷積層,獲得第一個編碼卷積層輸出的第一圖像特征;
將第t-1個編碼卷積層輸出的第t-1圖像特征和所述目標碼率輸入至第t個編碼卷積層,獲得第t個編碼卷積層輸出的第t圖像特征,其中,2≤t≤n;
將t自增1,判斷t是否大于n;
若否,則繼續執行將第t-1個編碼卷積層輸出的第t-1圖像特征和所述目標碼率輸入至第t個編碼卷積層,獲得第t個編碼卷積層輸出的第t圖像特征的操作;
若是,則確定最后一個所述編碼卷積層輸出的圖像特征為所述樣本圖像對應的圖像特征,并根據所述圖像特征確定所述圖像特征對應的圖像特征向量。
4.如權利要求3所述的圖像壓縮模型的訓練方法,獲得第一個編碼卷積層輸出的第一圖像特征,包括:
對所述樣本圖像做卷積下采樣,提取所述樣本圖像的圖像特征;
根據所述樣本圖像的圖像特征和所述目標碼率獲得第一個編碼卷積層輸出的第一圖像特征。
5.如權利要求3所述的圖像壓縮模型的訓練方法,獲得第t個編碼卷積層輸出的第t圖像特征,包括:
對所述第t-1圖像特征做卷積下采樣,提取所述第t-1圖像特征的圖像特征;
根據所述第t-1圖像特征的圖像特征和所述目標碼率獲得第t個編碼卷積層輸出的第t圖像特征。
6.如權利要求2所述的圖像壓縮模型的訓練方法,所述解碼器包括m個依次連接的解碼卷積層,其中,m>1;
將所述圖像特征向量和所述目標碼率輸入至所述解碼器,獲得所述樣本圖像對應的目標圖像,包括:
將所述圖像特征向量和所述目標碼率輸入至第一個解碼卷積層,獲得第一個解碼卷積層輸出的第一解碼向量;
將第j-1個編碼卷積層輸出的第j-1解碼向量和所述目標碼率輸入至第j個解碼卷積層,獲得第j個解碼卷積層輸出的第j解碼向量,其中,2≤j≤m;
將j自增1,判斷j是否大于m;
若否,則繼續執行將第j-1個編碼卷積層輸出的第j-1解碼向量和所述目標碼率輸入至第j個解碼卷積層,獲得第j個解碼卷積層輸出的第j解碼向量的操作;
若是,則確定最后一個所述解碼卷積層輸出的解碼向量為所述樣本圖像對應的解碼向量,并對所述解碼向量做歸一化處理,獲得所述樣本圖像對應的目標圖像。
7.如權利要求6所述的圖像壓縮模型的訓練方法,獲得第一個解碼卷積層輸出的第一解碼向量,包括:
對所述圖像特征向量做卷積上采樣,獲得所述圖像特征向量的初始解碼向量;
根據所述圖像特征向量的初始解碼向量和所述目標碼率獲得第一個解碼卷積層輸出的第一解碼向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010784856.8/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





