[發明專利]一種基于深度學習的運動目標檢測方法有效
| 申請號: | 201710226749.1 | 申請日: | 2017-04-10 |
| 公開(公告)號: | CN107123131B | 公開(公告)日: | 2020-04-17 |
| 發明(設計)人: | 張卡;何佳;尼秀明 | 申請(專利權)人: | 安徽清新互聯信息科技有限公司 |
| 主分類號: | G06T7/292 | 分類號: | G06T7/292;G06T7/246;G06N3/04 |
| 代理公司: | 合肥天明專利事務所(普通合伙) 34115 | 代理人: | 金凱 |
| 地址: | 230088 安徽省合肥市蜀山*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 運動 目標 檢測 方法 | ||
1.一種基于深度學習的運動目標檢測方法,其特征在于,包括:
S1、對構建的深度神經網絡模型進行訓練,得到具有分辨有意義運動目標能力的目標神經網絡模型,具體包括如下步驟:
S11、基于LeNet-5卷積神經網絡模型進行改進,構建深度神經網絡模型;
S12、根據不同攝像機應用場景下的鄰近兩幀圖像中對應位置的子區域圖像對,收集訓練樣本數據;具體包括:
在每個攝像機應用場景下,獲取間隔時間間隔為t秒的鄰近兩幀圖像,形成圖像對,其中t為常數;
在每個圖像對中,根據隨機產生的圖像位置和子區域圖像裁剪尺寸,在兩幀圖像的對應位置,分別裁剪出尺寸相同的子區域圖像,形成子區域圖像對;
每個子區域圖像對的相似度,如果子區域圖像對的相似度小于預設閾值T1,則將該子區域圖像對作為訓練正樣本;
如果子區域圖像對的相似度大于預設閾值T2,則將該子區域圖像對作為訓練負樣本,其中T1、T2均為常數,且T2>T1;
S13、基于caffe深度學習框架,利用訓練樣本數據對深度神經網絡模型進行訓練,得到目標神經網絡模型;
S2、利用目標神經網絡模型,從采集的當前場景圖像中檢測運動目標,具體包括如下步驟:
S21、加載目標神經網絡模型,以及獲取當前攝像機場景下的初始背景圖像;
S22、采集當前攝像機場景下的實時幀圖像;
S23、檢測當前攝像機場景下的實時幀圖像是否存在可疑運動目標;
S24、如果存在可疑運動目標,獲取可疑運動目標的位置矩形作為候選運動目標;
S25、利用目標神經網絡模型,在所有候選運動目標內篩選真實的運動目標;
S26、如果不存在可疑運動目標,將采集的攝像機場景下的當前幀圖像作為新的背景圖像。
2.如權利要求1所述的方法,其特征在于,具體包括:
利用相似度計算公式,計算每個子區域圖像對的相似度,其中相似度計算公式如下:
其中,simi表示相似度,H1[i]表示子區域圖像對中第一幅圖像的特征向量的第i維分量,H2[i]表示子區域圖像對中第二幅圖像的特征向量的第i維分量,n表示特征向量的維數,H1是子區域圖像對中第一幅子區域圖像的全局特征直方圖和局部特征直方圖串聯得到的合成向量,H2是子區域圖像對中第二幅子區域圖像的全局特征直方圖和局部特征直方圖串聯得到的合成向量。
3.如權利要求1或2所述的方法,其特征在于,所述的步驟S13,具體包括:
基于caffe深度學習框架,將訓練樣本數據中的每一對子區域圖像對融合為一個2通道的輸入圖像;
對2通道的輸入圖像的尺寸進行歸一化處理,得到歸一化后的輸入圖像;
利用歸一化后的輸入圖像,對所述構建的深度神經網絡模型進行訓練,得到目標神經網絡模型。
4.如權利要求2所述的方法,其特征在于,所述的局部特征直方圖的計算過程,包括:
將每個子區域圖像對中的每個子區域圖像均勻分割成9個局部子區域;
利用特征向量直方圖計算公式,計算每個局部子區域對應的特征向量直方圖,其中,特征向量直方圖計算公式如下:
其中,hist[i]表示特征向量直方圖的第i維分量,Mag(x,y)表示像素(x,y)處的梯度幅值,ang(x,y)表示像素(x,y)處的梯度方向角,β表示直方圖每一維覆蓋的角度范圍,其中,Mag(x,y)和ang(x,y)的計算公式如下:
其中,g(x,y)表示像素(x,y)處的灰度值,atan()表示反正切三角函數。
5.如權利要求1所述的方法,其特征在于,所述的步驟S23,具體包括:
獲取所述當前攝像機場景下的當前幀圖像和當前幀圖像之前的m幀圖像之間的像素灰度差異二值圖像;
基于形態學原理,去除像素灰度差異二值圖像中孤立的點,得到處理后的像素灰度差異二值圖像;
去除處理后的像素灰度差異二值圖像中的干擾連通區域,得到目標像素灰度差異二值圖像;
在目標像素灰度差異二值圖像中,將所有連通區域作為可疑運動目標,并將連通區域的最小外接矩形作為可疑運動目標的位置矩形。
6.如權利要求1所述的方法,其特征在于,所述的步驟S24,具體包括:
在同一攝像機場景下的初始化背景圖像和當前幀圖像中,在相同的所述候選運動目標區域處分別獲取檢測子區域圖像,形成待檢測子區域圖像對;
將待檢測子區域圖像對融合為一個2通道的待檢測輸入圖像;
對所述2通道的待檢測輸入圖像的尺寸進行歸一化處理,得到歸一化后的待檢測輸入圖像;
將歸一化后的待檢測輸入圖像送入所述的目標卷積神經網絡模型,判斷是否存在真實運動目標;
如果是,則保留可疑運動目標的位置矩形;
如果否,則刪除可疑運動目標位置矩形。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽清新互聯信息科技有限公司,未經安徽清新互聯信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710226749.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種圖像處理裝置及方法
- 下一篇:一種統計背景模型的運動目標檢測方法





