[發明專利]圖像識別方法和裝置有效
申請號: | 201110361083.3 | 申請日: | 2011-11-15 |
公開(公告)號: | CN103106387A | 公開(公告)日: | 2013-05-15 |
發明(設計)人: | 趙顏果;鄭鋒;宋展 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06T7/00 |
代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 吳平 |
地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 圖像 識別 方法 裝置 | ||
【技術領域】
本發明涉及圖像分析領域,特別是涉及一種圖像識別方法和裝置。
【背景技術】
近年來,隨著智能終端設備的普及,尋求一種更自然更簡單的人機交互方式已然成為科研和產業領域的熱點問題。縱觀人機交互技術的發展歷史,已逐漸從鼠標、鍵盤、遙控器等方式發展為視覺、語音、姿態等非接觸式的操作方式,而且視覺技術作為其中最為重要的手段。即通過攝像頭獲取畫面,基于圖像智能分析技術判斷操作者的動作和意圖,進而控制機器。但其所面臨最大的問題是環境的復雜性和不確定性,使得該技術還未完全成熟。隨著3D技術的發展,微軟推出了Kinect系統,其通過動態三維重建技術,將人機交互由2D的圖像空間拓展到真實的3D空間,3D空間的深度信息有效的解決了2D空間中較為復雜的背景分割問題,使得該技術趨于成熟,并已應用到電視機、游戲機等設備中,用做外置的人機交互設備。
傳統技術的不足是:
(1)基于輔助設備的手勢人機交互方式:需要用戶手持或者穿戴具有明顯標記物的手柄或者手套,用于降低視覺檢測和識別的難度,但卻失去了手勢操作本該具有的自然性和便利性;
(2)基于視覺的手勢識別操作技術:受限于其算法的穩定性和抗干擾性,當場景較為復雜或者外界光照影響較為嚴重時,其手勢目標檢測準確性和跟蹤及識別的準確率急劇下降,根源于其機器學習和模式識別算法的有效性和魯棒性;
(3)基于3D技術的手勢體感控制技術:以微軟Kinect系統為代表的該技術通過動態三維重構技術實現了對場景的三維實時重建,將視覺檢測算法由2D導入3D空間進行,降低了識別的難度,但增加了硬件成本和計算量,而且產品體積較大,很難嵌入到現有的智能終端設備中。
【發明內容】
基于傳統技術的各種不足,有必要提供一種識別精度更高的圖像識別方法和裝置。
一種圖像識別方法,包括如下步驟:
步驟S201,獲取待檢測圖像;
步驟S202,通過預設窗口從所述待檢測圖像上截取得到窗口圖像;
步驟S203,利用至少二種分辨率分別將所述窗口圖像剖分為多個細胞單元,同一種分辨率下,所述細胞單元的尺寸相同,分辨率越高,所述細胞單元尺寸越小;
步驟S204,提取各個分辨率下所述細胞單元的梯度方向直方圖;
步驟S205,分別將同一分辨率下的所有所述細胞單元的所述梯度方向直方圖結合,得到對應分辨率下所述窗口圖像的梯度方向直方圖;
步驟S206,根據各個分辨率對應的所述窗口圖像的所述梯度方向直方圖和預設的判定函數,計算得到各個分辨率下所述窗口圖像和目標圖像的相似度值;
步驟S207,根據預設的判定閥值和各個分辨率對應的所述相似度值,分別判定各個分辨率下所述窗口圖像是否為所述目標圖像;
步驟S208,在所有分辨率下均判定所述窗口圖像是所述目標圖像時,最終判定所述窗口圖像是所述目標圖像。
本發明一較佳實施例中,所述步驟S203中所述至少二種分辨率的剖分執行順序是從低到高的逐個執行,并且是在某一分辨率下所述步驟S207判定所述窗口圖像是所述目標圖像后,所述步驟S203再進行更高分辨率的剖分;當在某一分辨率下所述步驟S207判定所述窗口圖像不是所述目標圖像,則所述步驟S203不進行更高分辨率的剖分,此時就最終判定所述窗口圖像不是所述目標圖像。
本發明一較佳實施例中,在提取所述細胞單元的梯度方向直方圖時,一個像素點對與該像素點梯度方向相近的幾個角度區間都做投票,所述像素點的梯度方向距離某個角度區間中心的距離越近則投票的權重越大,反之則越小。
本發明一較佳實施例中,當所述像素點的梯度方向距離某個角度區間中心的距離超過預設距離閾值,該像素點不對該區間進行投票。
本發明一較佳實施例中,所述步驟S204中,高分辨率下提取的所述細胞單元的梯度方向直方圖的維數大于或等于低分辨率下所述細胞單元的梯度方向直方圖的維數。
一種圖像識別裝置,其包括圖像獲取單元和截圖單元,所述圖像獲取單元用于獲取待檢測圖像;所述截圖單元用于通過預設窗口從所述待檢測圖像上截取得到窗口圖像;所述圖像識別裝置還包括:
剖分單元,用于利用至少二種分辨率分別將所述窗口圖像剖分為多個細胞單元,同一種分辨率下,所述細胞單元的尺寸相同,分辨率越高,所述細胞單元尺寸越小;
提取單元,用于提取各個分辨率下所述細胞單元的梯度方向直方圖;
整合單元,用于分別將同一分辨率下的所有所述細胞單元的梯度方向直方圖結合,得到對應分辨率下所述窗口圖像的梯度方向直方圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110361083.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:抹泥板支架
- 下一篇:微齒隼鉚框式基板兩層實木復合地板
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序