[發明專利]圖像編碼方法、圖像解碼方法、裝置以及存儲介質在審
| 申請號: | 202210772560.3 | 申請日: | 2022-06-30 |
| 公開(公告)號: | CN115361559A | 公開(公告)日: | 2022-11-18 |
| 發明(設計)人: | 陳瑤;江東;林聚財;粘春湄;殷俊 | 申請(專利權)人: | 浙江大華技術股份有限公司 |
| 主分類號: | H04N19/20 | 分類號: | H04N19/20;H04N19/12;H04N19/44 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 嚴翠霞 |
| 地址: | 310051 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 編碼 方法 解碼 裝置 以及 存儲 介質 | ||
本申請公開了一種圖像編碼方法、圖像解碼方法、裝置以及計算機存儲介質,該圖像編碼方法包括:獲取待處理圖像的待編碼特征;對所述待編碼特征進行特征變換,得到變換特征,其中,所述變換特征的特征維度低于所述待編碼特征的特征維度;基于配置參數,將所述變換特征進行量化處理,得到量化特征;對所述量化特征進行特征編碼,得到特征碼流。本申請的圖像編碼方法能夠通過簡單有效的量化方式,進一步提升特征的編碼率。
技術領域
本申請涉及特征編碼技術領域,特別是涉及一種圖像編碼方法、圖像解碼方法、裝置以及計算機存儲介質。
背景技術
傳統的圖像編碼技術是針對人類視覺特性設計的,而隨著深度神經網絡在各項機器視覺任務中展現出的優越性能,例如圖像分類、目標檢測、語義分割等,涌現出大量基于機器視覺的人工智能應用。為了保證機器視覺任務的性能不因圖像編碼過程而受損,采取先分析后編碼的模式應對機器視覺需求,即在圖像獲取端直接將無損的圖像通過神經網絡進行特征提取,然后對所提取的特征進行編碼傳輸,解碼端直接利用解碼后的特征輸入到后續網絡結構中完成不同的機器視覺任務。因此,為了節省傳輸帶寬資源,需要研究針對機器視覺的圖像編碼方法。
目前的特征編碼算法主要有兩大類:基于傳統的編碼方法和基于學習的方案。其中基于傳統的編碼方法主要有以下幾種,一是通過使用低精度的數據類型來替代高精度的數據類型,從而減少原始特征數據所占用的空間,但是其本質上并不是真正的對特征數據的編碼,而是從計算機存儲的角度來實現的;二是通過降維的方式,例如PCA(主成分分析法),來提取原始特征數據的主要數據成分信息,從而可以使用低維度的數據來大體上表示原始數據的信息,屬于有損編碼。三是混合編碼器方案,即先將深度特征進行量化,然后使用例如高效率視頻編碼(HEVC)、H.266/VVC等編碼器對量化后的特征進行有損編碼。該方案的缺點在于,混合編碼器的有損編碼降質與特征在進行視覺分析任務時性能的降質不一致,會導致特征無法提供視覺分析需要的重要信息。
發明內容
本申請提供一種圖像編碼方法、圖像解碼方法、圖像編碼裝置以及計算機存儲介質。
本申請采用的一個技術方案是提供一種圖像編碼方法,所述圖像編碼方法包括:
獲取待處理圖像的待編碼特征;
對所述待編碼特征進行特征變換,得到變換特征,其中,所述變換特征的特征維度低于所述待編碼特征的特征維度;
基于配置參數,將所述變換特征進行量化處理,得到量化特征;
對所述量化特征進行特征編碼,得到特征碼流。
其中,所述對所述待編碼特征進行特征變換,得到變換特征,包括:
將所述待編碼特征輸入降維網絡,通過所述降維網絡的卷積層和/或全連接層對所述待編碼特征進行下采樣,得到所述變換特征。
其中,所述降維網絡的卷積層為一維卷積層或二維卷積層。
其中,所述降維網絡還包括空間特征變換子網絡、通道注意力機制子網絡、自注意力機制子網絡中的一種或多種。
其中,所述將所述待編碼特征輸入降維網絡,包括:
將所述待編碼特征依次輸入所述降維網絡的若干降維子網絡,每個所述降維層子網絡包括依次串聯的全連接層、歸一化層以及激活層。
其中,所述對所述待編碼特征進行特征變換,得到變換特征,包括:
基于無監督類降維算法和有監督類降維算法中的至少一種,對所待編碼特征進行特征稀疏化處理,得到所述變換特征。
其中,所述基于配置參數,將所述變換特征進行量化處理,得到量化特征,包括:
獲取預設線性變換函數,并基于所述配置參數,對所述預設線性變換函數中的非學習參數進行賦值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大華技術股份有限公司,未經浙江大華技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210772560.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





