[發明專利]圖像識別方法、裝置、電子設備和計算機可讀介質在審
| 申請號: | 202010098022.1 | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111291817A | 公開(公告)日: | 2020-06-16 |
| 發明(設計)人: | 王塑;竇毅琨;劉宇;王亞可;王澤榮 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 安衛靜 |
| 地址: | 100000 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 識別 方法 裝置 電子設備 計算機 可讀 介質 | ||
本發明提供了一種圖像識別方法、裝置、電子設備和計算機可讀介質,涉及圖像處理的技術領域,包括獲取待識別圖像;并將待識別圖像輸入至目標神經網絡中,得到待識別圖像的特征信息和待識別圖像的重構圖像,其中,目標神經網絡包括特征提取網絡和重構網絡;基于待識別圖像的特征信息和目標分類特征信息計算目標損失函數,以及基于重構圖像計算目標神經網絡中重構網絡的重構損失函數;基于目標損失函數和重構損失函數確定待識別圖像的樣本類型,本申請緩解了在采用傳統圖像分類方法確定圖像的樣本類型時,分類準確度較差的技術問題。
技術領域
本發明涉及圖像處理的技術領域,尤其是涉及一種圖像識別方法、裝置、電子設備和計算機可讀介質。
背景技術
當前,訓練處理遮擋、活體、檢測等開集問題時,往往是通過同時采集正樣本數據和負樣本數據來訓練神經網絡模型。但是,在開集問題中,負樣本數據類型幾乎是無法窮盡的。這給開集問題的訓練帶來非常大的困難。以遮擋問題為例,負樣本中采集一些遮擋類型后,如手、比等物體后,其很難保證在樹葉、座椅等物體遮擋上同樣能夠實現準確的識別率。
為了解決開集問題,傳統技術存在以下幾種方法:
方法一、在特征空間中判斷待分類樣本到已分類樣本之間的L2距離。其中,L2距離越大,則樣本為負樣本的可能性越大;
方法二、在訓練分類問題的同時,同時訓練重構問題。即將訓練原圖首先變換到特征,再由特征變換到恢復圖,從而通過判斷原圖和恢復圖的之間精確度,來判斷樣本是否為負樣本,其中,負樣本恢復的精度更小。
但是,上述方法存在以下問題:當特征提取模型對待分類樣本和已分類樣本進行處理后,存在可能,使待分類樣本和已分類樣本這兩張圖在相同的特征空間上,而這會導致方法一失效,無法進行判斷。而方法二,一種特殊情況是,當特征提取模型保留了所有的原圖信息時,總是存在方法將特征圖重構回原圖,從而使方法失效。
發明內容
有鑒于此,本發明的目的在于提供一種圖像識別方法、裝置、電子設備和計算機可讀介質,以緩解了在采用傳統圖像分類方法確定圖像的樣本類型時,分類準確度較差的技術問題。
第一方面,本發明實施例提供了一種圖像識別方法,包括:獲取待識別圖像;并將所述待識別圖像輸入至目標神經網絡中,得到所述待識別圖像的特征信息和所述待識別圖像的重構圖像,其中,所述目標神經網絡包括特征提取網絡和重構網絡;基于所述待識別圖像的特征信息和目標分類特征信息計算目標損失函數,以及基于所述重構圖像計算所述目標神經網絡中重構網絡的重構損失函數,其中,所述目標分類特征信息為特征提取網絡確定出的所述待識別圖像所屬分類的特征信息;基于所述目標損失函數和所述重構損失函數確定所述待識別圖像的樣本類型。
進一步地,所述目標神經網絡包括以下至少之一:單類型神經網絡、多類型神經網絡和未知多類型神經網絡;所述單類型神經網絡的分類類別為一種;所述多類型神經網絡的分類類別為多種;所述未知多類型神經網絡的分類類別為多種,且多種分類類別中包含已知分類類別和未知分類類別。
進一步地,所述目標神經網絡為所述單類型神經網絡;基于所述目標損失函數和所述重構損失函數確定所述待識別圖像的樣本類型包括:獲取第一損失閾值和第二損失閾值;若所述目標損失函數大于所述第一損失閾值,和/或,所述重構損失函數大于所述第二損失閾值,則確定所述待識別圖像的樣本類型為負樣本。
進一步地,所述目標神經網絡為所述多類型神經網絡;所述方法還包括:獲取所述特征提取網絡的各個分類類別的分類特征信息;基于所述待識別圖像的特征信息和所述分類特征信息計算所述待識別圖像所屬于每個分類類別的第一預測概率,得到多個第一預測概率;基于所述多個第一預測概率在多個分類類別確定所述待識別圖像所屬的目標分類類別;將所述目標分類類別對應的特征信息確定為所述目標分類特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010098022.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于識別文字的方法和裝置
- 下一篇:天線切換電路、天線切換方法及裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





