[發明專利]一種基于圖像的行人檢測方法及裝置在審
| 申請號: | 201710648627.1 | 申請日: | 2017-08-01 |
| 公開(公告)號: | CN107563290A | 公開(公告)日: | 2018-01-09 |
| 發明(設計)人: | 高萬林;陳治昌;于麗娜;仲貞;張國鋒;于麗敏 | 申請(專利權)人: | 中國農業大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/62 |
| 代理公司: | 北京路浩知識產權代理有限公司11002 | 代理人: | 王瑩,李官 |
| 地址: | 100193 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 圖像 行人 檢測 方法 裝置 | ||
技術領域
本發明涉及計算機視覺技術領域,具體涉及一種基于圖像的行人檢測方 法及裝置。
背景技術
近年來,以機器學習為主導的人工智能發展迅猛,在眾多領域都取得了 重大突破。計算機視覺就是人工智能領域下一個非常重要的研究熱點和難點, 在計算機視覺領域下目標的檢測又是研究的重點,其中最為活躍的一個研究 方向就是關于行人的檢測。行人檢測即是將圖像中出現的行人從背景中區分 出來并精準定位。但是由于人體姿態各異,衣著變化多樣,圖像容易受到光 照和環境影響,以及人體部位被遮擋等因素,行人檢測一直是計算機視覺領 域研究的難點。在現實生活中,行人檢測在許多領域都有廣泛應用。如視頻 監控領域、智能機器人領域、汽車輔助駕駛和自動駕駛領域,這些領域中行 人檢測是必不可少的技術。在社會邁向智能化的道路上,行人檢測會發揮越 來越大的作用,然而當前的行人檢測方法的準確性卻達不到應用要求,所以 針對行人檢測的困難研究設計具有魯棒性方法是非常重要的。
因此,如何有效提高行人檢測方法的準確性和檢測效率是一個亟待解決 的問題。
發明內容
針對現有技術中的缺陷,本發明實施例提供一種基于圖像的行人檢測方 法及裝置。
第一方面,本發明實施例提供一種基于圖像的行人檢測方法,所述方法 包括:
接收原始圖像,并對所述原始圖像進行處理得到所述原始圖像的圖像特 征圖;
提取所述原始圖像的通道特征,并對所述通道特征進行處理得到通道深 度特征圖;
將所述圖像特征圖和所述通道深度特征圖依次連接,并輸入所述圖像特 征圖和所述通道深度特征圖到改進后的區域建議網絡RPN模型中,以使所述 改進后的區域建議網絡RPN模型輸出候選目標區域;
輸入所述候選目標區域到圖像判別模型中,以使所述圖像判別模型輸出 定位行人的矩形框,從而輸出行人檢測結果。
可選的,所述對所述原始圖像進行處理得到所述原始圖像的圖像特征圖 具體包括:
使用在圖像識別網絡ImageNet上預先訓練過的圖像分類模型VGG16網 絡作為主體網絡對所述原始圖像進行特征提取,經過四層深度卷積神經網絡 對所述原始圖像進行處理得到所述原始圖像的圖像特征圖。
可選的,所述對所述通道特征進行處理得到通道深度特征圖具體包括:
對所述原始圖像進行預處理,在所述預處理階段對所述原始圖像進行一 系列的線性和非線性的變換,每個圖像經過不同的變換得到一個通道,再輸 入所述通道特征到一個三層的卷積神經網絡中進行處理得到所述通道深度特 征圖。
可選的,所述圖像判別模型具體包括:
一個感興趣區域模型ROI層,兩個全連接層,一個邏輯回歸層和一個邊 框Bbox回歸層。
可選的,所述通道具體包括:
顏色空間LUV通道、梯度強度通道和梯度直方圖通道。
第二方面,本發明實施例提供一種基于圖像的行人檢測裝置,所述裝置 包括:
圖像特征圖獲取模塊,用于接收原始圖像,并對所述原始圖像進行處理 得到所述原始圖像的圖像特征圖;
通道深度特征圖獲取模塊,用于提取所述原始圖像的通道特征,并對所 述通道特征進行處理得到通道深度特征圖;
候選目標區域輸出模塊,用于將所述圖像特征圖和所述通道深度特征圖 依次連接,并輸入所述圖像特征圖和所述通道深度特征圖到改進后的區域建 議網絡RPN模型中,以使所述改進后的區域建議網絡RPN模型輸出候選目 標區域;
檢測結果輸出模塊,用于輸入所述候選目標區域到圖像判別模型中,以 使所述圖像判別模型輸出定位行人的矩形框,從而輸出行人檢測結果。
可選的,所述圖像特征圖獲取模塊具體用于:
使用在圖像識別網絡ImageNet上預先訓練過的圖像分類模型VGG16網 絡作為主體網絡對所述原始圖像進行特征提取,經過四層深度卷積神經網絡 對所述原始圖像進行處理得到所述原始圖像的圖像特征圖。
可選的,所述通道深度特征圖獲取模塊具體用于:
對所述原始圖像進行預處理,在所述預處理階段對所述原始圖像進行一 系列的線性和非線性的變換,每個圖像經過不同的變換得到一個通道,再輸 入所述通道特征到一個三層的卷積神經網絡中進行處理得到所述通道深度特 征圖。
可選的,所述圖像判別模型具體包括:
一個感興趣區域模型ROI層,兩個全連接層,一個邏輯回歸層和一個邊 框Bbox回歸層。
可選的,所述通道具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國農業大學,未經中國農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710648627.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





