[發明專利]一種基于RGBD的行人檢測和身份識別方法及系統有效
| 申請號: | 201710272095.6 | 申請日: | 2017-04-24 |
| 公開(公告)號: | CN107045630B | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 張紹明 | 申請(專利權)人: | 杭州艾芯智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06K9/54;G06K9/46;G06K7/10 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司 11514 | 代理人: | 安娜 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 rgbd 行人 檢測 身份 識別 方法 系統 | ||
本發明公開了一種基于RGBD的行人檢測和身份識別方法及系統,所述方法包括:輸入RGBD圖像,對所述RGBD圖像進行預處理;構建所述RGBD圖像的多通道特征和尺度列表;根據所述多通道特征,訓練得到檢測分類器;采用所述檢測分類器,根據所述尺度列表,對行人進行檢測和身份識別。本發明基于RGBD多通道特征的融合,使得對行人的檢測和身份的識別,魯棒性和準確性更高,應用場景更廣。
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種行人檢測和身份識別方法及系統。
背景技術
行人檢測是指通過圖像處理及模式識別等算法對視頻或靜態圖像中所包含的行人具體位置進行檢測。作為目標檢測的一個重要方向,行人檢測技術在家居服務機器人、智能監控、智能交通、輔助駕駛等方面有著廣泛的應用前景。與普通的物體檢測相比,行人的非剛體性和多樣性等特點大大提高了有效檢測行人的難度。目前行人檢測可以分為兩類:1)基于背景建模的方法:分割出前景,提取其中的運動目標,然后進一步提取特征,分類判別;2)基于統計學習的方法,根據大量訓練樣本構建行人檢測分類器。
第一種方法在下雨、下雪、刮風、樹葉晃動、燈光忽明忽暗等場合下,抗干擾能力較差,魯棒性不高。第二種方法存在以下問題:由于行人的姿態、服飾各不相同,使得分類器的性能受訓練樣本的影響較大,所涵蓋的應用場景有限。
行人身份識別是指將檢測出來的行人的特征進行分析,判斷是否屬于某一個行人,達到識別該行人身份的目的。目前行人身份識別,主要是通過提取具有一定鑒別性的特征,來對行人進行識別。但該方法只能利用行人的外貌特征來進行識別,而無法使用臉部的有效信息;另外,由于尺度、光照和角度的變化,同一個行人的不同圖片中,外貌特征會有一定程度的變化,不同行人的外貌特征可能比同一個人的外貌特征更相似,從而在識別的過程中影響準確性,容易混淆。
發明內容
針對現有技術中的缺陷,本發明提供一種基于RGBD的行人檢測和身份識別方法及系統,能夠基于RGBD多通道特征的融合,使得對行人的檢測和身份的識別,魯棒性和準確性更高,應用場景更廣。
第一方面,本發明提供了一種基于RGBD的行人檢測和身份識別方法,所述方法包括:
輸入RGBD圖像,對所述RGBD圖像進行預處理;其中,所述RGBD圖像包括彩色圖像和深度圖像;
構建所述RGBD圖像的多通道特征和尺度列表;
根據所述多通道特征,訓練得到檢測分類器;
采用所述檢測分類器,根據所述尺度列表,對行人進行檢測和身份識別。
進一步地,所述多通道特征包括:RGB多通道特征,深度多通道特征;所述構建所述RGBD圖像的多通道特征,具體包括:構建RGB多通道特征,以及構建深度多通道特征。
進一步地,所述構建RGB多通道特征,具體包括:
將RGB顏色空間轉換為LUV顏色空間;
在所述LUV顏色空間中,計算梯度幅值和梯度方向;
將所述梯度方向進行量化,根據所述梯度幅值和量化后的所述梯度方向,計算所述梯度方向直方圖的方向通道。
進一步地,所述在所述LUV顏色空間中,計算梯度幅值和梯度方向,具體包括:
估算所述彩色圖像的彩色像素點處的水平方向梯度和垂直方向梯度;
根據所述水平方向梯度和所述垂直方向梯度,計算所述彩色像素點處的梯度幅值和梯度方向。
進一步地,根據所述水平方向梯度和所述垂直方向梯度,計算所述彩色像素點處的梯度幅值和梯度方向,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州艾芯智能科技有限公司,未經杭州艾芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710272095.6/2.html,轉載請聲明來源鉆瓜專利網。





