[發明專利]一種基于RGBD的行人檢測和身份識別方法及系統有效
| 申請號: | 201710272095.6 | 申請日: | 2017-04-24 |
| 公開(公告)號: | CN107045630B | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 張紹明 | 申請(專利權)人: | 杭州艾芯智能科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06K9/54;G06K9/46;G06K7/10 |
| 代理公司: | 北京酷愛智慧知識產權代理有限公司 11514 | 代理人: | 安娜 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 rgbd 行人 檢測 身份 識別 方法 系統 | ||
1.一種基于RGBD的行人檢測和身份識別方法,其特征在于,所述方法包括:
輸入RGBD圖像,對所述RGBD圖像進行預處理;其中,所述RGBD圖像包括彩色圖像和深度圖像;
構建所述RGBD圖像的多通道特征和尺度列表;
根據所述多通道特征,訓練得到檢測分類器;
采用所述檢測分類器,根據所述尺度列表,對行人進行檢測和身份識別;
所述采用所述檢測分類器,根據所述尺度列表,對行人進行檢測和身份識別,具體包括:
采用所述檢測分類器,搜索所述尺度列表對應的尺度空間,得到包含行人信息的行人框圖;
在所述行人框圖中,搜索包含行人ID的二維碼;
識別二維碼中包含的行人ID,確定行人的身份;
重建行人三維信息,對于標定好的圖片,利用二維碼的規格以及二維碼在原圖中的位置,反算出二維碼和相機之間的位置關系,進一步與行人在RGBD圖像中的三維信息進行比對,從而確定行人身份;
在行人三維信息重建步驟中,由行人框圖在原始圖片中的像素位置、相機的內方位元素和深度信息,根據成像原理,計算出行人的大致三維信息,另外,通過二維碼的四個角點在原始圖片中的像素值,亦可大致算出二維碼與相機之間的位置關系,兩者結合可重建出行人的三維信息,結合二維碼識別所確定的行人ID,準確高效地確定行人的身份。
2.根據權利要求1所述的行人檢測和身份識別方法,其特征在于,所述多通道特征包括:RGB多通道特征,深度多通道特征;
所述構建所述RGBD圖像的多通道特征,具體包括:構建RGB多通道特征,以及構建深度多通道特征。
3.根據權利要求2所述的行人檢測和身份識別方法,其特征在于,所述構建RGB多通道特征,具體包括:
將RGB顏色空間轉換為LUV顏色空間;
在所述LUV顏色空間中,計算梯度幅值和梯度方向;
將所述梯度方向進行量化,根據所述梯度幅值和量化后的所述梯度方向,計算所述梯度方向直方圖的方向通道。
4.根據權利要求3所述的行人檢測和身份識別方法,其特征在于,所述在所述LUV顏色空間中,計算梯度幅值和梯度方向,具體包括:
估算所述彩色圖像的彩色像素點處的水平方向梯度和垂直方向梯度;
根據所述水平方向梯度和所述垂直方向梯度,計算所述彩色像素點處的梯度幅值和梯度方向。
5.根據權利要求4所述的行人檢測和身份識別方法,其特征在于,根據所述水平方向梯度和所述垂直方向梯度,計算所述彩色像素點處的梯度幅值和梯度方向,具體包括:
根據所述水平方向梯度和所述垂直方向梯度,計算所述彩色像素點處的LUV三通道的第一梯度幅值;
選取多個第一梯度幅值中的最大值,作為所述像素點處的梯度幅值;
根據所述最大值對應的所述水平方向梯度和所述垂直方向梯度,計算相應的梯度方向,作為所述像素點處的梯度方向。
6.根據權利要求2所述的行人檢測和身份識別方法,其特征在于,所述構建深度多通道特征,具體包括:
計算所述深度圖像的深度像素點處的水平方向梯度和垂直方向梯度;
根據所述深度像素點處的水平方向梯度和垂直方向梯度,計算所述深度像素點處的深度梯度幅值和深度梯度方向;
計算所述深度法向量方向。
7.根據權利要求1所述的行人檢測和身份識別方法,其特征在于,所述構建所述RGBD圖像的尺度列表,具體包括:
計算所述深度圖像每個像素點對應的尺度,對所述尺度進行量化;
量化后的多個所述尺度構成尺度列表。
8.根據權利要求1所述的行人檢測和身份識別方法,其特征在于,根據所述多通道特征,訓練得到檢測分類器,具體包括:
采集多個多通道特征作為訓練樣本;
采用AdaBoost分類器對所述訓練樣本進行訓練,得到檢測分類器;
其中,所述AdaBoost分類器為多個弱分類器級聯而成。
9.一種基于RGBD的行人檢測和身份識別系統,其特征在于,所述系統包括:輸入模塊,特征構建模塊,訓練模塊,檢測識別模塊;
其中,所述輸入模塊與所述特征構建模塊連接,所述特征構建模塊與所述訓練模塊連接,所述訓練模塊與所述檢測識別模塊連接;
所述輸入模塊,用于輸入RGBD圖像,對所述RGBD圖像進行預處理;
所述特征構建模塊,用于構建所述RGBD圖像的多通道特征和尺度列表;
所述訓練模塊,用于根據所述多通道特征,訓練得到檢測分類器;
所述檢測識別模塊,用于采用所述檢測分類器,根據所述尺度列表,對行人進行檢測和身份識別;搜索所述尺度列表對應的尺度空間,得到包含行人信息的行人框圖,在所述行人框圖中,搜索包含行人ID的二維碼;根據所述二維碼,識別二維碼中包含的行人ID,確定行人的身份;重建行人三維信息,對于標定好的圖片,利用二維碼的規格以及二維碼在原圖中的位置,反算出二維碼和相機之間的位置關系,進一步與行人在RGBD圖像中的三維信息進行比對,從而確定行人身份識別行人的身份,在行人三維信息重建步驟中,由行人框圖在原始圖片中的像素位置、相機的內方位元素和深度信息,根據成像原理,計算出行人的大致三維信息,另外,通過二維碼的四個角點在原始圖片中的像素值,亦可大致算出二維碼與相機之間的位置關系,兩者結合可重建出行人的三維信息,結合二維碼識別所確定的行人ID,準確高效地確定行人的身份。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州艾芯智能科技有限公司,未經杭州艾芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710272095.6/1.html,轉載請聲明來源鉆瓜專利網。





