[發明專利]圖像處理方法和裝置有效
| 申請號: | 201910384600.5 | 申請日: | 2019-05-09 |
| 公開(公告)號: | CN110222717B | 公開(公告)日: | 2022-01-14 |
| 發明(設計)人: | 楊朝暉;王云鶴;許春景 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;H03M7/30 |
| 代理公司: | 北京龍雙利達知識產權代理有限公司 11329 | 代理人: | 孫濤;毛威 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 處理 方法 裝置 | ||
本申請公開了人工智能領域中計算機視覺領域的一種圖像處理方法及裝置。其中,該圖像處理方法,包括:獲取待處理圖像;根據目標圖像壓縮網絡對該待處理圖像進行壓縮處理,得到該待處理圖像的目標壓縮圖像,其中,該目標圖像壓縮網絡的參數是根據該目標圖像壓縮網絡對樣本圖像進行壓縮處理的圖像損失確定的,該圖像損失包括感知損失,該感知損失是指該樣本圖像的特征向量與該樣本圖像對應的壓縮圖像的特征向量之間的差異,該待處理圖像的特征向量與該目標壓縮圖像的特征向量的差異在預設范圍內;基于該目標壓縮圖像進行識別,得到識別結果。本申請的技術方案能夠提高計算機視覺系統識別目標壓縮圖像的準確率。
技術領域
本申請涉及人工智能領域,更具體地,涉及計算機視覺領域中的圖像處理方法和裝置。
背景技術
隨著圖像處理技術的不斷發展,以及人們對圖像顯示畫質要求的不斷提升,神經網絡(例如,深度神經網絡)近年來在在圖像處理領域得到了快速發展,尤其在電子設備(例如,手機、攝像頭、智能家居、自動駕駛汽車)上的應用也越來越多,例如,人臉識別、物體檢測、場景分割等。
圖像壓縮技術是圖像存儲、處理和傳輸的基礎,是指用盡可能少的數據來進行圖像的存儲和傳輸。其中,大多數情況下,并不要求經壓縮處理后的壓縮圖像和原圖完全相同,而允許存在少量失真,只要這些失真不被人眼察覺均可以接受。正因為如此,可以在允許保真度的條件下壓縮待存儲的圖像數據,大大節約存儲空間,而且在圖像傳輸時也大大減少信道容量。然而,越來越多的壓縮圖像會進行后續任務的處理,例如,壓縮圖像可以通過使用卷積神經網絡進行分類、識別等。但是,人眼所認為的相似圖像和機器所能識別的圖像之間往往存在較大的差異,通過傳統的圖像處理方法獲得的壓縮圖像往往在后續任務中表現不盡如人意甚至導致計算機視覺系統無法識別。
因此,如何提高計算機視覺系統識別壓縮圖像的準確率成為一個亟需解決的問題。
發明內容
本申請提供一種圖像處理方法、裝置、計算機可讀存儲介質和芯片,以使得提高計算機視覺系統識別壓縮圖片的準確率。
第一方面,提供了一種圖像處理方法,該方法包括:獲取待處理圖像;根據目標圖像壓縮網絡對所述待處理圖像進行壓縮處理,得到所述待處理圖像的目標壓縮圖像,其中,所述目標圖像壓縮網絡的參數是根據所述目標圖像壓縮網絡對樣本圖像進行壓縮處理的圖像損失確定的,所述圖像損失包括感知損失,所述感知損失是指所述樣本圖像的特征向量與所述樣本圖像對應的壓縮圖像的特征向量之間的差異,所述待處理圖像的特征向量與所述目標壓縮圖像的特征向量的差異在預設范圍內;基于所述目標壓縮圖像進行識別,得到識別結果。
上述圖像損失可以包括基于機器視覺系統的認知標準的感知損失。
例如,感知損失可以是樣本圖像和樣本圖像對應的壓縮圖像的關鍵區域的特征向量。例如,樣本圖像可以是一張動物圖像,關鍵區域可以是樣本動物圖像與樣本動物圖像對應的壓縮圖像中動物臉部的特征向量;例如,樣本圖像可以是一張汽車圖像,關鍵區域可以是樣本汽車圖像與樣本汽車圖像對應的壓縮圖像中汽車車輪部分的特征向量,通過關鍵區域的特征向量可以有效的區分或者識別不同的圖像。
應理解,待處理圖像的特征向量與所述目標壓縮圖像的特征向量的差異可以是指特征向量之間的距離,其中,特征向量之間的距離越近意味著差異越小。在本申請中待處理圖像的特征向量與目標壓縮圖像的特征向量的差異在預設范圍內意味著待處理圖像與目標壓縮圖像之間具有感知一致性,即計算機視覺系統識別待處理圖像和識別目標壓縮圖像得到的識別結果相同。
在本申請的實施例中,可以通過目標壓縮網絡對待處理圖像進行壓縮處理,得到待處理圖像對應的目標壓縮圖像,其中,待處理圖像的特征向量與目標壓縮圖像的特征向量的差異在預設范圍內,即意味著通過本申請實施例的目標圖像壓縮網絡得到的壓縮圖像進行后續識別得到的識別結果與識別待處理圖像的識別結果相同,也就是說,在本申請中待處理圖像與得到的目標壓縮圖像之間具有感知一致性,從而能夠提高計算機視覺系統識別壓縮圖像的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910384600.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于全分辨率深度卷積神經網絡的圖像分類方法
- 下一篇:圖像處理的方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





