[發明專利]一種基于深度學習的圖像無損/近無損壓縮方法在審
| 申請號: | 202210009301.5 | 申請日: | 2022-01-06 |
| 公開(公告)號: | CN114359422A | 公開(公告)日: | 2022-04-15 |
| 發明(設計)人: | 劉賢明;柏園超;季向陽 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00;G06N3/04;G06N3/08 |
| 代理公司: | 哈爾濱市晨晟知識產權代理有限公司 23219 | 代理人: | 劉文權 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 圖像 無損 壓縮 方法 | ||
1.一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,包括以下步驟:
步驟a:通過有損圖像壓縮網絡,對原始圖像進行有損壓縮,得到有損圖像壓縮碼流和有損重構圖像;
步驟b:計算有損重構圖像與原始圖像的原始殘差,根據給定誤差上界對原始殘差進行量化;
步驟c:如果:
給定誤差上界為零,量化殘差等于原始殘差,則采用無損殘差壓縮網絡對原始殘差進行壓縮;
給定誤差上界大于零,則采用近無損殘差壓縮網絡對量化殘差進行壓縮;
步驟d:把有損圖像壓縮碼流和原始殘差或者量化殘差的壓縮碼流連接在一起,得到圖像無損/近無損壓縮結果;
步驟e:以圖像有損壓縮網絡計算得到的有損壓縮碼率、無損殘差壓縮網絡計算得到的原始殘差壓縮碼率、以及有損重構圖像的失真損失建立目標函數,通過反向傳播算法聯合優化圖像有損壓縮網絡和無損殘差壓縮網絡;
步驟f:以無損殘差壓縮網絡和近無損殘差壓縮網絡分別估計得到的原始殘差概率分布建立損失函數,優化近無損殘差壓縮網絡。
2.根據權利要求1所述的一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,步驟a的方法如下:把原始圖像x輸入圖像變換網絡并量化,得到隱變量利用超先驗編碼網絡提取隱變量的特征并量化,得到隱變量的超先驗計算超先驗的概率模型對超先驗進行算術編碼,得到超先驗的碼流;利用超先驗解碼網絡,計算條件概率模型對隱變量進行算術編碼,得到隱變量的碼流;隱變量的碼流與超先驗的碼流連接,即為有損圖像壓縮碼流;隱變量輸入圖像反變換網絡,得到有損重構圖像
3.根據權利要求1所述的一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,步驟b的方法如下:計算有損重構圖像與原始圖像x的原始殘差根據給定誤差上界τ對原始殘差進行量化,得到量化殘差其中sgn()為符號函數,i為殘差的位置坐標。
4.根據權利要求1所述的一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,步驟c的方法如下:
若誤差上界τ=0,那么量化殘差等于原始殘差r,采用無損殘差壓縮網絡對原始殘差r進行壓縮:把原始殘差r的先驗u與上下文Cr輸出無損殘差概率密度估計網絡,估計原始殘差r的概率模型pθ(r|u,Cr),對原始殘差r進行算術編碼,得到原始殘差r的碼流;
若誤差上界τ>0,那么采用近無損殘差壓縮網絡對量化殘差進行壓縮:把原始殘差r的先驗u與量化殘差的上下文輸出近無損殘差概率密度估計網絡,以誤差上界τ為條件,近似估計原始殘差r的概率模型對原始殘差r的概率模型進行量化,得到量化殘差的概率模型對量化殘差進行算術編碼,得到量化殘差的碼流。
5.根據權利要求1所述的一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,在步驟e中,所述圖像有損壓縮碼率為:
所述原始殘差的壓縮碼率為:
所述有損壓縮重構失真為:
所述目標函數為:
其中,為隱變量的超先驗的概率分布,為以超先驗為條件的隱變量的條件概率分布;pθ(r|u,Cr)為無損殘差壓縮網絡輸出的原始殘差r的概率分布,u為原始殘差r的先驗,Cr為原始殘差r的上下文;x為原始圖像,為有損重構圖像;N為訓練樣本數目,M為每一幅訓練圖像的像素數目,λ為可調節的權重系數。
6.根據權利要求1所述的一種基于深度學習的圖像無損/近無損壓縮方法,其特征在于,在步驟f中,所述無損殘差壓縮網絡輸出的原始殘差r的概率分布為:
pθ(r|u,Cr)
所述近無損殘差壓縮網絡輸出的原始殘差r的概率分布為:
所述損失函數為:
其中,N為訓練樣本數目,M為每一幅訓練圖像像素數目;u為原始殘差r的先驗,Cr為原始殘差r的上下文,為量化殘差的上下文。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210009301.5/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





