[發明專利]深度圖像壓縮方法及其裝置、設備和存儲介質在審
| 申請號: | 201811258164.9 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN111107377A | 公開(公告)日: | 2020-05-05 |
| 發明(設計)人: | 胡強;石志儒 | 申請(專利權)人: | 曜科智能科技(上海)有限公司 |
| 主分類號: | H04N19/91 | 分類號: | H04N19/91;H04N19/124;H04N19/184;H04N19/597;H04N13/161 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 高彥 |
| 地址: | 201203 上海市浦東新區中*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 圖像 壓縮 方法 及其 裝置 設備 存儲 介質 | ||
本發明提供的一種深度圖像壓縮方法及其裝置、設備和存儲介質,通過對深度圖像進行正變以得到特征系數矩陣,并通過高斯概率模型對量化后的特征系數矩陣進行熵編碼以得到對應的特征系數碼流,以及對所述深度圖像的元信息進行旁路熵編碼以得到對應的元信息碼流,最后合并所述特征系數碼流及所述元信息碼流以作為所述深度圖像的壓縮數據。本發明能夠深度圖像壓縮導致合成視圖失真的問題,并且在壓縮性能方面超越傳統編碼標準JPEG和BPG。
技術領域
本發明涉及深度圖像處理技術領域。尤其是涉及一種深度圖像壓縮方法及其裝置、設備和存儲介質。
背景技術
光場視頻作為一種新型的數字媒體,通過提供多個視點的視頻數據使用戶自由選擇視點從多個角度觀看三維立體場景,其獨特的立體感和視點間交互功能使它廣泛應用于三維電視、自由視點電視和光場監控等多個領域。光場視頻包含了大量的數據信息,從而導致了存儲和傳輸的巨大壓力,如何高效地對光場視頻進行壓縮成為制約其發展的瓶頸?;谏疃葓D像繪制的虛擬視圖合成是光場視頻應用中的關鍵技術,它利用參考視點的視頻數據和相應的深度圖像合成任意視點的視圖,其合成視圖的質量很大程度上依賴于深度圖像的質量。
在過去的幾十年中,一系列的圖像編碼標準被廣泛地應用。目前已有的圖像壓縮標準有很多種,包括聯合圖片專家組制定的JPEG和JPEG2000,由國際標準化組織/國際電工技術委員會發布的PNG等。但上述圖像壓縮是針對傳統圖像的,并不是針對深度圖像的。與視頻圖像不同,深度圖像是包含大量的均勻區域、更多的空間冗余和銳利邊界的灰度圖,使用傳統的圖像編碼方法對深度圖像進行壓縮會在邊界處產生嚴重的失真,從而影響合成視圖的質量。
因此,基于深度圖像在圖像處理和機器視覺任務中的關鍵作用,亟需一種針對深度圖像壓縮減少或取出失真的辦法。
發明內容
鑒于以上所述現有技術的缺點,本發明的目的在于提供一種深度圖像壓縮方法及其裝置、電子設備和存儲介質,用于解決現有技術中對深度圖像進行壓縮會產生嚴重失真的問題。
為實現上述目的及其他相關目的,本發明提供一種深度圖像壓縮方法,所述方法包括:對深度圖像進行基于自編碼網絡的正變換處理以得到表征所述深度圖像的信息的特征系數矩陣;對所述特征系數矩陣進行量化處理,并通過高斯概率模型對量化后的所述特征系數矩陣進行熵編碼,以得到對應的特征系數碼流;對所述深度圖像的元信息進行旁路熵編碼以得到對應的元信息碼流;合并所述特征系數碼流及所述元信息碼流以作為所述深度圖像的壓縮數據。
于本發明的一實施例中,所述特征系數矩陣能經過自編碼網絡的反變換以重構出所述深度圖像的像素值。
于本發明的一實施例中,所述正變換與所述反變換呈對稱結構,分別由6層卷積層、及5層歸一化層組成。
于本發明的一實施例中,所述量化處理為標量量化,包括:對輸入值進行四舍五入量化處理,以及選取最接近所述輸值入的整數作為輸出值。
于本發明的一實施例中,在所述自編碼網絡進行訓練時,通過增加隨機均勻噪聲來近似所述量化處理,使得編解碼過程變得可導。
于本發明的一實施例中,所述高斯概率模型是通過對所述深度圖像的特征系數進行基于高斯分布的概率建模得到的。
于本發明的一實施例中,所述對所述深度圖像的元信息進行旁路熵編碼以得到對應的元信息碼流的方法包括:對所述深度圖像的長和寬分別使用2個16比特的整數進行二進制化,并采用旁路二進制數字編碼得到二進制碼流;對所述高斯概率模型對應的序號使用8比特的整數進行二進制化,并采用旁路二進制數字編碼得到二進制碼流;匯總對應所述深度圖像的長和寬的二進制碼流、及對應所述高斯概率模型對應的序號的二進制碼流以得到所述元信息碼流。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于曜科智能科技(上海)有限公司,未經曜科智能科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811258164.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:汽車及其車載顯示裝置
- 下一篇:一種陳皮檸檬羅漢果茶及其制備方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





