[發(fā)明專利]圖像處理方法及裝置、電子設備和存儲介質在審
| 申請?zhí)枺?/td> | 202210564531.8 | 申請日: | 2022-05-23 |
| 公開(公告)號: | CN114972554A | 公開(公告)日: | 2022-08-30 |
| 發(fā)明(設計)人: | 何岱嵐;王巖;楊孜名;秦紅偉 | 申請(專利權)人: | 北京市商湯科技開發(fā)有限公司 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100080 北京市海淀區(qū)北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 電子設備 存儲 介質 | ||
本公開涉及一種圖像處理方法及裝置、電子設備和存儲介質,所述方法包括:獲取待編碼的第一圖像的第一整數(shù)特征信息和第一編碼邊信息;根據(jù)第一整數(shù)特征信息和第一編碼邊信息,獲得熵編碼參數(shù);根據(jù)熵編碼參數(shù)、第一編碼邊信息和第一整數(shù)特征信息進行編碼處理,獲得所述第一圖像的第一編碼結果。根據(jù)本公開的實施例的圖像處理方法,通過整數(shù)定點化處理,使得神經網(wǎng)絡輸出的浮點數(shù)等參數(shù)成為確定的值,在跨平臺使用神經網(wǎng)絡進行編碼時能夠保持獲得的參數(shù)一致,從而獲得跨平臺編碼能力,減少跨平臺應用時解碼圖像失真的可能性。
技術領域
本公開涉及計算機技術領域,尤其涉及一種圖像處理方法及裝置、電子設備和存儲介質。
背景技術
基于深度學習的圖像編碼受限于IEEE754浮點數(shù)系統(tǒng)的計算非確定性。在不同的軟、硬件平臺上,對于相同的數(shù)值輸入,浮點數(shù)運算的結果并不能保持一致。上述情況可能導致解碼圖像失真,這對于實現(xiàn)跨平臺的深度視覺編碼及傳輸是不利的。
發(fā)明內容
本公開提出了一種圖像處理方法及裝置、電子設備和存儲介質。
根據(jù)本公開的一方面,提供了一種圖像處理方法,包括:獲取待編碼的第一圖像的第一整數(shù)特征信息和第一編碼邊信息;根據(jù)所述第一整數(shù)特征信息和第一編碼邊信息,獲得熵編碼參數(shù),所述熵編碼參數(shù)為通過整數(shù)定點化處理后的神經網(wǎng)絡獲得的編碼信息,所述整數(shù)定點化處理用于使神經網(wǎng)絡的輸出信息為整數(shù)信息;根據(jù)所述熵編碼參數(shù)、所述第一編碼邊信息和所述第一整數(shù)特征信息進行編碼處理,獲得所述第一圖像的第一編碼結果。
根據(jù)本公開的實施例的圖像處理方法,通過整數(shù)定點化處理,使得神經網(wǎng)絡輸出的浮點數(shù)等參數(shù)成為確定的值,在跨平臺使用神經網(wǎng)絡進行編碼時能夠保持獲得的參數(shù)一致,從而獲得跨平臺編碼能力,減少跨平臺應用時解碼圖像失真的可能性。
在一種可能的實現(xiàn)方式中,所述獲取待編碼的第一圖像的第一整數(shù)特征信息和第一編碼邊信息,包括:將所述第一圖像輸入第一編碼網(wǎng)絡,獲取第一特征信息;將所述第一特征信息輸入第二編碼網(wǎng)絡,獲得第三特征信息;對所述第三特征信息進行取整處理,獲得所述第一編碼邊信息;將所述第一特征信息進行取整處理,獲得所述第一整數(shù)特征信息。
通過這種方式,可獲得各元素均為整數(shù)的第一編碼邊信息和第一整數(shù)特征信息,以減少編碼冗余,并減少浮點數(shù)運算的不確定性。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述第一整數(shù)特征信息和第一編碼邊信息,獲得熵編碼參數(shù),包括:將所述第一編碼邊信息輸入整數(shù)定點化處理后的第一解碼網(wǎng)絡,獲得第二特征信息;根據(jù)所述第二特征信息和所述第一整數(shù)特征信息,獲得所述熵編碼參數(shù)。
通過這種方式,可通過整數(shù)定點化處理后的第一解碼網(wǎng)絡獲得第二特征信息減少計算結果的不確定性,提升熵編碼參數(shù)的準確性。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述第二特征信息和所述第一整數(shù)特征信息,獲得熵編碼參數(shù),包括:根據(jù)所述第二特征信息和所述第一整數(shù)特征信息,獲得第一超驗特征信息和第二超驗特征信息,所述第一超驗特征信息和所述第二超驗特征信息分別與所述第一整數(shù)特征信息的部分特征對應;根據(jù)所述第一超驗特征信息、所述第二超驗特征信息和所述整數(shù)定點化處理后的參數(shù)預測網(wǎng)絡,獲得第一熵編碼估計參數(shù)和第二熵編碼估計參數(shù);根據(jù)所述第一熵編碼估計參數(shù)和所述第二熵編碼估計參數(shù),獲得所述熵編碼參數(shù)。
通過這種方式,可基于第一整數(shù)特征信息對第二特征信息進行參數(shù)預測處理,提升獲得的熵編碼參數(shù)的準確性。
在一種可能的實現(xiàn)方式中,所述根據(jù)所述第二特征信息和所述第一整數(shù)特征信息,獲得第一超驗特征信息和第二超驗特征信息,包括:將所述第一整數(shù)特征信息進行分解,獲得第二整數(shù)特征信息和第三整數(shù)特征信息;根據(jù)所述第二整數(shù)特征信息和所述第二特征信息,獲得所述第一超驗特征信息;根據(jù)所述第三整數(shù)特征信息和所述第二特征信息,獲得所述第二超驗特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發(fā)有限公司,未經北京市商湯科技開發(fā)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210564531.8/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





