[發明專利]一種圖像識別方法和裝置在審
| 申請號: | 201710317890.2 | 申請日: | 2017-05-08 |
| 公開(公告)號: | CN107292229A | 公開(公告)日: | 2017-10-24 |
| 發明(設計)人: | 李圣喜 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 莎日娜 |
| 地址: | 100083 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 識別 方法 裝置 | ||
技術領域
本發明涉及圖像識別領域,特別是涉及一種圖像識別方法,以及,一種圖像識別裝置。
背景技術
目前的圖像識別技術中,主要是針對圖像中一個完整而且常規姿態的對象的整體特征進行識別。例如,如果在圖像中存在一個正面的完整人體,則可以識別該圖像包含有人物圖像。
然而在實際應用中,圖像中人體可能并不完整。例如,某些圖像中的人體被景物或靜物部分遮擋,僅可見人體側面或部分肢體;又或者,下蹲的人體僅可見頭部和手臂,而采用目前的圖像識別技術,由于圖像中的人體不完整或姿態不規則,無法識別出圖像中存在人體對象。對于動物、靜物等其他物體對象的識別中,也存在著無法針對不完整、不規則的對象進行分類識別的問題。
因此,目前的圖像識別方法存在著識別準確率較低的問題。
發明內容
鑒于上述的圖像識別準確率較低的問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的一種圖像識別方法和一種圖像識別裝置。
根據本發明的一個方面,提供了一種圖像識別方法,所述方法包括:
采用預先收集的圖像樣本訓練用于預測圖像分類的預測數據集合;其中,所述圖像樣本包括完整目標對象的圖像、部分目標對象的圖像和不包含目標對象的圖像,所述圖像分類包括包含目標對象的目標圖像類別和不包含目標對象的非目標圖像類別;
利用所述預測數據集合對當前圖像進行圖像分類識別,獲得圖像分類預測結果;
根據所述圖像分類預測結果判定所述當前圖像屬于目標圖像類別或非目標圖像類別。
可選地,所述方法還包括:
若判定所述當前圖像屬于非目標圖像類別,則按照預設尺寸比例放大所述當前圖像;
將放大的當前圖像劃分成多個子圖像;
采用所述預測數據集合基于各個子圖像進行圖像分類識別。
可選地,所述將放大的當前圖像劃分成多個子圖像包括:
在放大的當前圖像上按照設定滑動幅度移動至少一個具有設定范圍的圖像標記窗口;
針對每次移動,將處于圖像標記窗口內的部分圖像作為一個子圖像,并在多次移動后,得到所述當前圖像對應的多個子圖像。
可選地,所述完整目標對象的圖像包括完整目標對象在多個視角的圖像中的一種或多種,所述部分目標對象的圖像包括部分目標對象在多個視角的圖像中的一種或多種。
可選地,所述目標對象為人體,所述完整目標對象的圖像包括人體的正面、側面、背面的圖像中的一種或多種,所述部分目標對象的圖像包括人體軀干、肢體的正面、側面、背面的圖像中的一種或多種。
根據本發明的另一個方面,提供了一種圖像識別裝置,所述裝置包括:
預測數據集合訓練模塊,用于采用預先收集的圖像樣本訓練用于預測圖像分類的預測數據集合;其中,所述圖像樣本包括完整目標對象的圖像、部分目標對象的圖像和不包含目標對象的圖像,所述圖像分類包括包含目標對象的目標圖像類別和不包含目標對象的非目標圖像類別;
圖像分類識別模塊,用于利用所述預測數據集合對當前圖像進行圖像分類識別,獲得圖像分類預測結果;
圖像類別判定模塊,用于根據所述圖像分類預測結果判定所述當前圖像屬于目標圖像類別或非目標圖像類別。
可選地,所述裝置還包括:
圖像放大模塊,用于若判定所述當前圖像屬于非目標圖像類別,則按照預設尺寸比例放大所述當前圖像;
子圖像劃分模塊,用于將放大的當前圖像劃分成多個子圖像;
子圖像分類識別模塊,用于采用所述預測數據集合基于各個子圖像進行圖像分類識別。
可選地,所述子圖像劃分模塊包括:
窗口移動子模塊,用于在放大的當前圖像上按照設定滑動幅度移動至少一個具有設定范圍的圖像標記窗口;
子圖像獲取子模塊,用于針對每次移動,將處于圖像標記窗口內的部分圖像作為一個子圖像,并在多次移動后,得到所述當前圖像對應的多個子圖像。
根據本發明的另一個方面,提供了一種計算機設備,所述計算機設備包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述圖像識別方法的任意一項所述方法的步驟。
根據本發明的另一方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現上述圖像識別方法的任意一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710317890.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





