[發(fā)明專利]一種密集人數(shù)計數(shù)的方法、裝置、設備以及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201910294403.4 | 申請日: | 2019-04-12 |
| 公開(公告)號: | CN110084155B | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設計)人: | 張莉;陸金剛;王邦軍;周偉達 | 申請(專利權(quán))人: | 蘇州大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V20/52;G06N3/04 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 羅滿 |
| 地址: | 215104 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 密集 人數(shù) 計數(shù) 方法 裝置 設備 以及 存儲 介質(zhì) | ||
1.一種密集人群計數(shù)的方法,其特征在于,包括:
將待測試圖像輸入預先完成訓練的目標殘差多尺度卷積神經(jīng)網(wǎng)絡,其中,所述目標殘差多尺度卷積神經(jīng)網(wǎng)絡中的兩個預選卷積層之間設有殘差單元;
利用所述目標殘差多尺度卷積神經(jīng)網(wǎng)絡對所述待測試圖像進行處理,得到所述待測試圖像的目標估計密度圖并輸出;
依據(jù)所述目標估計密度圖,確定所述待測試圖像中的人數(shù);
還包括:
獲取預先構(gòu)建的人群圖像數(shù)據(jù)集,其中,所述人群圖像數(shù)據(jù)集包括i張人群圖像,與每張人群圖像分別對應的人頭坐標點圖;
利用高斯濾波器對所述每張人群圖像進行濾波處理后,利用所述每張人群圖像的初始化為零矩陣的密度圖和所述每張人群圖像的人頭中心坐標,確定所述每張人群圖像的真實密度圖;
利用所述每張人群圖像和所述每張人群圖像的人的真實密度圖,構(gòu)建目標訓練集;
在多尺度卷積神經(jīng)網(wǎng)絡的兩個預設卷積層之間添加所述殘差單元,得到初始殘差多尺度卷積神經(jīng)網(wǎng)絡模型;
利用所述目標訓練集對所述初始殘差多尺度卷積神經(jīng)網(wǎng)絡模型進行訓練,得到完成訓練后的目標殘差多尺度卷積神經(jīng)網(wǎng)絡;
所述在多尺度卷積神經(jīng)網(wǎng)絡的兩個預設卷積層之間添加所述殘差單元,得到初始殘差多尺度卷積神經(jīng)網(wǎng)絡模型包括:
在所述多尺度卷積神經(jīng)網(wǎng)絡的第五卷積層和第六卷積層之間添加一個所述殘差單元,得到初始殘差尺度卷積神經(jīng)網(wǎng)絡。
2.如權(quán)利要求1所述的方法,其特征在于,所述初始殘差尺度卷積神經(jīng)網(wǎng)絡的網(wǎng)絡結(jié)構(gòu)包括:
第一卷積層,第二卷積層,第三卷積層,第四卷積層,第五卷積層,第六卷積層,反卷積層,第七卷積層,第八卷積層和第九卷積層;
其中,所述第一卷積層、所述第二卷積層、所述第三卷積層和所述第四卷積層均采用VGG16網(wǎng)絡結(jié)構(gòu);
所述第一卷積層至所述第五卷積層的相鄰卷積層之間 均采用2×2區(qū)域,步長為2的最大池化,激活函數(shù)采用ReLU函數(shù);
所述第五卷積層和所述第六卷積層之間采用3×3區(qū)域,步長為1的最大池化;
所述第五卷積層輸出的特征圖和所述第六卷積層輸出的特征圖在通道上串聯(lián);
所述第五卷積層和所述第六卷積層之間設有所述殘差單元;
所述第四卷積層輸出的特征圖和所述反卷積層采用得到的特征圖在通道上串聯(lián);
所述第九卷積層的卷積核為1×1,并將所述第九卷積層輸出的特征圖作為所述初始殘差尺度卷積神經(jīng)網(wǎng)絡的網(wǎng)絡輸出。
3.如權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述目標估計密度圖,確定所述待測試圖像中的人數(shù)包括:
根據(jù)所述目標估計密度圖中所有像素值的和,確定所述待測試圖像中的人數(shù)。
4.一種密集人群計數(shù)的裝置,其特征在于,包括:
輸入模塊,用于將待測試圖像輸入預先完成訓練的目標殘差多尺度卷積神經(jīng)網(wǎng)絡,其中,所述目標殘差多尺度卷積神經(jīng)網(wǎng)絡中的兩個預選卷積層之間設有殘差單元;
輸出模塊,利用所述目標殘差多尺度卷積神經(jīng)網(wǎng)絡對所述待測試圖像進行處理,得到所述待測試圖像的估計密度圖并輸出;
確定模塊,用于依據(jù)所述目標估計密度圖,確定所述待測試圖像中的人數(shù);
還包括:
訓練模塊,用于獲取預先構(gòu)建的人群圖像數(shù)據(jù)集,其中,所述人群圖像數(shù)據(jù)集包括i張人群圖像,與每張人群圖像分別對應的人頭坐標點圖;
利用高斯濾波器對所述每張人群圖像進行濾波處理后,利用所述每張人群圖像的初始化為零矩陣的密度圖和所述每張人群圖像的人頭中心坐標,確定所述每張人群圖像的真實密度圖;
利用所述每張人群圖像和所述每張人群圖像的人的真實密度圖,構(gòu)建目標訓練集;
在多尺度卷積神經(jīng)網(wǎng)絡的兩個預設卷積層之間添加所述殘差單元,得到初始殘差多尺度卷積神經(jīng)網(wǎng)絡模型;
利用所述目標訓練集對所述初始殘差多尺度卷積神經(jīng)網(wǎng)絡模型進行訓練,得到完成訓練后的目標殘差多尺度卷積神經(jīng)網(wǎng)絡。
5.如權(quán)利要求4所述的裝置,其特征在于,所述確定模塊具體用于:
根據(jù)所述目標估計密度圖中所有像素值的和,確定所述待測試圖像中的人數(shù)。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州大學,未經(jīng)蘇州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910294403.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





